独角兽突破进化武器的人工智能底层平台产品 发布时间:2020-03-26
在芯片之外,人工智能基础设施的战争已经开始。继百度和华为之后,艾独角兽师旷科技也宣布开放源于研究的底层框架平台“天元”。
在过去的六个月里,师旷科技公司吸引了很多关注。2019年8月25日,师旷提交了港股招股说明书,港股被认为是“艾未未的第一股”。据知情人士透露,师旷已通过听证会,上市进程仍在正常进行。
在中美贸易战的背景下,人们普遍认为有必要将核心技术掌握在自己手中。在人工智能领域,芯片和底层框架是基础设施,分别提供计算能力和算法。但这是一个门槛问题。首先,并非所有公司都有能力从0到1构建底层框架。第二,不是每个人都有开源的能力。“BATH需要并且需要这样做。其他公司可以选择修改现有的平台,或者制作一个底层框架供自己使用。”华创资本的创始合伙人熊伟明告诉《财经》。
许多人工智能专业人士和关注人工智能的投资者告诉《财经》,基本框架是大公司的游戏。由于投资巨大,短期内无法带来直接的商业价值,真正的人工智能平台级技术和产品尚未出现。。“一方面,如果你想让基础框架平台成为可持续的研发投资,你必须有足够的现金流支持。另一方面,底层技术和平台产品的专业门槛决定了并非所有拥有资本和资源的大公司都能做到这一点。”一位知名机构投资者表示。
截至2019年6月30日,师旷的研发团队共有1400多人。2016年、2017年、2018年及截至2019年6月30日的6个月,师旷研发投资分别为7820万元、2.054亿元、6.129亿元和4.683亿元。
师旷表示,对底层研发的投资是一项战略,从师旷创立之初就一直延续至今。人工智能底层框架和技术平台的布局是从2014年开始的,在这个时候选择开源节点是战略的延续,而不是一个新项目。
“人工智能+”已经成为一种新趋势。越来越多的传统产业希望整合新技术,这也促进了人工智能产业的快速发展。第三方分析机构CBInsights发布的《2019年人工智能趋势报告》指出,从行业采用和市场优势两个分析维度来看,开源底层的深度学习框架是趋势的核心,已经有极高的行业采用率,市场将会越来越大。
对于开发人员来说,是否以及何时开源并不是最重要的,最重要的开源系统的功能是否真的有用,它是否能帮助他们解决问题,开源社区的活动,以及不断更新和升级的能力。
对于其他企业用户,他们只需要能够降低成本和提高效率的产品和服务。这就像消费者想买的是一部好手机,他们不一定对操作系统有具体要求。
开放愿景的雄心:从自用到开源
师旷成立于2011年,自成立以来一直专注于计算机视觉技术。起初,技术人员使用Antano框架编写模型代码,训练神经网络,并为每次训练运行编译几个小时。
人工智能可以实现从技术到应用。它需要算法、计算力和数据的支持。计算力取决于芯片/显卡的性能。该算法需要验证底层框架,这通常被业内人士称为“运行算法”。这就像道家的“炼丹”过程。为了提炼出一种“人工智能魔法”来解决行业中的问题,有必要将各种“金木火、水、土”的海量数据倒入底部框架中的“炼丹炉”中等待结果。炼金术炉的性能和效率决定了炼金术是否无效。早期的框架完全是手动的,需要研究人员一层一层地编写配置文件,这非常不灵活。
随着网络变得越来越复杂,师旷认为安诺已经不能满足需求,开始简单地在这些初始框架上封装一层代码来解决冗长代码的问题。然而,培训效率仍然不能满足快速变化的需要,一个“炼金术”项目可能需要5周的时间来验证。
2014年初,师旷研究所的几名实习生开始尝试开发最初的底层框架。半年之内,由师旷开发的深度学习框架MegEngine的第一个版本诞生了。接下来,研究所与业务团队深入沟通,以了解一线需求,并重现业务所需的神经网络。此后,师旷研究所于2015年年中完成了自我研究框架与所有内部业务的整合。业务线上的所有模型都被自行研究框架训练的版本所取代,从而解决了算法训练效率的问题。
与此同时,师旷还提出了一个新的想法:如果要长期发展,就必须建立一套能够协调数据、算法和计算能力的人工智能平台级产品,即一套专门为人工智能服务的“可视化工作室”。因此,师旷同时建立了深度学习云计算平台MegCompute和数据管理平台MegData,在2014年提供计算能力调度支持。与MegEngine一起,它形成了师旷自己的人工智能生产力平台Brain++。
——2——2015年11月9日,谷歌的开源底层学习框架TensorFlow立即在谷歌内部引发了一场激烈的辩论。有些人认为大工厂已经开辟了新的收入来源,所以他们可以直接使用大工厂。其他人认为底层技术需要与前端业务相匹配,或者继续这样做是否有价值。
最重要的讨论持续了24小时。最后,每个人都决定进行一次大规模的练习,深入比较张量流和MegEngine的性能。结果,张量流的响应速度实际上比多元气体发动机慢10倍。这使得师旷内部统一了他的思想,强化了他继续研究底层框架的想法,继续投资于人工智能底层生产力平台成为公司的长期战略。
对师旷而言,对底层框架的自学可以首先更好地与业务相结合,并将拆分算法产品和方案升级为集成的全堆栈解决方案;第二是降低人员成本。师旷发现,在具体技术落地的过程中,许多公司仍然需要成立另一个人工智能研究团队。人工智能人才的培训成本非常高,最终的收入不足以支持团队。
师旷认为新一代框架的出现可以使人工智能“以成本为中心”。对于算法生产者来说,一站式开发工具的效率就像联合收割机,最初需要10个人来手工收割一块土地。有了这样的框架,一个人可以收获10块土地。
如果有更多的开源平台可供选择,它可能会帮助更多的企业,尤其是传统企业,解决人工智能应用的人工成本问题。考虑到这一点,师旷决定公开他开发的底层框架的源代码。
在师旷研究院拥有多年研发经验的开发人员表示,与市场上主流的深度学习框架相比,师旷·田原(MegEngine)起步更快,学习和迁移成本更低。
世界上主流的深度学习框架包括蒙特利尔理工大学于2008年推出的茶道、加州大学伯克利分校于2013年推出的咖啡、师旷于2014年推出的MegEngine、亚马逊于2015年底推出的MXNet、脸书于2017年推出的PyTorch、百度于2016年推出的Paddle,以及华为也计划于今年第一季度推出的智能计算框架MindSpore。值得注意的是,在所有采用开源框架的企业中,师旷是唯一一家基于人工智能解决方案的新公司。
——3——目前,中国的人工智能领域分为三个层次:以巴斯为代表的大公司,以艾四小龙为代表的独角兽部队,以及大量的中小初创企业。不同的公司在开放基础框架方面有不同的目的。一些公司正在着手发展基础设施。一些人去发展工业。例如,谷歌已经开放了其机器学习平台,其背后的意图可能是让更多用户使用TPU和谷歌云。师旷说,创建一个自我研究框架本质上是为了提供低成本的人工智能解决方案并吸引更多的用户,而选择在国外开源则是为了考虑激活更多的场景来扩展整个人工智能市场。
独角兽如何在巨人面前突围
目前,用户数量最多的开源平台是谷歌推出的Tensorflow。一位张量流用户告诉《财经》,他不想改变其他平台,因为张量流已经可以满足他的工作要求。
中国科学院自动化研究所的高级工程师吴俊宁告诉《财经》,张量流和PyTorch是目前在工业和学术界使用最广泛的开源平台。“开源平台最重要的指标是活动。它使用的人越多,对新用户的吸引力就越大。”
另一位人工智能业内人士告诉《财经》,当天梭流发布时,没有多少开源平台可供选择。迄今为止,许多人工智能应用程序都是在张量流的基础上开发的,“并且已经形成了紧密的联系”
面对这些具有先下手为强优势的巨头,师旷的应对策略是避开它们的尖锐优势,选择技术实力相对较弱的传统行业。师旷表示,大多数互联网公司已经具备人工智能能力,但许多传统行业公司,尤其是中小型公司,对人工智能技术没有远见。“要吸引他们,底层框架并不重要,重要的是,在这个底层框架上增长的应用程序可以让他们受益匪浅。”
师旷认为,在人工智能改造传统产业之前,它们都是由技术提供商定义的,用户参与和有限的效率。反过来,用户应该能够定义生产,即使提供了这种参与帮助。因此,传统企业应该有一套能够满足定制需求的算法生产力平台。
然而,传统企业是否真的需要这样一个平台还有待验证。对于企业来说,人工智能改造的预算来自于总体的信息技术预算。“如果我不确定这个平台能否带来价值,我暂时不会考虑。我们希望购买能够解决特定问题的工具和软件。但如果你能,当然,好的。”一家环保公司的总经理告诉《财经》记者。
对于大多数企业来说,人工智能开源平台起着锦上添花的作用,而不是提供及时的帮助。此外,他们没有考虑人工智能的技术有多先进。“更好的技术并不意味着能产生更好的结果,解决不同问题的技术途径是不同的。”一位参与投资几家人工智能公司的投资者告诉《财经》。
这位投资者还提到,许多人工智能公司喜欢将自己的表现与大型工厂进行比较。“性能并不代表商业价值。对于刚刚起步的公司,首先要做的是找到基准客户并形成基准案例。”这也是师旷取得突破的重点,并且已经取得了一些进展。
2020年初,当新的冠状病毒疫情爆发时,迫切需要更有效地进行温度检测。基于开放视图自主研究算法平台,开放视图在2天内完成了算法模型的训练和部署,在不到10天的时间内完成了人工智能测温系统的开发和上线,并在北京市海淀区多个地方进行了试点应用。
师旷的另一个基准案例来自一个从事工业电力的典型客户。在传统的生产线上,工厂在配电产品的生产过程中,经常面临配件配色错误、文字印刷不完整等质量问题。然而,人工视觉检测费时费力,传统机器视觉精度差,难以完成有效的质量检测。
为了解决这些问题,师旷人工智能生产力平台Brain++基于自主研究,为客户提供智能制造解决方案,为不同的生产线开发定制算法,并能在本地实现数据采集和模型再培训。其中包括通过数据管理平台MegData的数据增强技术不断扩展综合培训数据,以降低工厂数据的生产成本。同时,通过深度学习框架MegEngine的集成训练、推理和部署能力,实现生产线所需算法模型的快速选择、优化和封装。
该电气公司通过Brain++实现的智能质量检测算法,有效降低了生产线中漏色、不完整字符和误检率,大大提高了工厂的生产效率。
据上述投资者称,人工智能平台企业需要花费大量的时间和精力,在早期阶段免费深入客户的业务流程,并为此类案例提供定制服务。“如何快速复制这些案例,让更多的企业和开发人员快速上手,这是一个留给人工智能底层平台建设企业的问题,因此真正的人工智能平台产品的包容性、易用性、可视化和一站式尤为重要。”
对人工智能低层框架的竞争才刚刚开始。很难预测未来的发展方向。目前还不清楚在不同的子行业中是否会有不同的低层框架,或者它是否是唯一的一个。也是在市场结构尚未完全确定的时候,独角兽提供了一个与巨人竞争的黄金窗口。
(资料来源:Caijing.com)
相关文章推荐
- 山东省为湖北省防疫和控制捐赠了10亿
- 金被发现在音乐会上作弊,并一度假装
- 刘备见人时说他是钟的。刘备和刘胜是
- 揭示雍正帝的特殊爱好,喜欢给大臣们
- 钟一生中从未打过一次著名的战役。为
- 当海印的财富管理公司计划裁员三分之
- 200,000名股东激动不已!从下限到上
- 苏宁瑞城启动230万美元基准科技城建
- 中国在意大利的防疫:从误解到赞美
- 2020年,空调品牌承受不起损失
- 龙脊股份(601012。上海:控股股东李春
- 不到两周,情节就会逆转!美国拒绝接
- 谁比NBA总决赛冠军更强?乔丹8-4,科
- 买车后,这10样东西一定在你的车里。
- 独立教练:我非常希望把阿奎罗和卢卡
- 李:西班牙体力和驾照都在手。我的家
- 七年前的今天,热火失去了詹伟,波什
- 前意大利小姐在科斯塔库塔吐口水:和
- [晨谈]是时候展示你的大脑了!让我们
- 4月1日河北疫情最新消息:2例新输入病
- 如果没有奔驰和宝马,BAIC华晨的“空
- 通用汽车下周交付首批20,000个口罩
- 穆尼:我的目标是在巴黎疫情期间和我
- 赖斯身体:巴洛特利失去了俱乐部和球
- 谢晖:从助理教练到教练是很自然的。
- 巴拉圭前锋的近1000件球衣被盗!包括
- 博腾事故:无人员伤亡,财产损失约25
- "显然我应该战术性地为梅西服务!"
- 怡保体育用爱心赞助波尔多,携手展示
- 马德里竞技主席:现在讨论军事问题没
- 美国新增确诊病例累计超过170,000例
- ANSA:孔蒂和国际球员都愿意减薪,目

