云知声黄伟:面向AIoT时代我们为什么必须要做芯片?

  “只有具备全栈式的AI技术能力、已经经过验证的、成熟的业务场景和一定的芯片设计能力,三者结合在一起,才有可能真正的研发出一颗有竞争力的芯片。”

  i黑马讯(王妍)7月6日消息,由创业黑马主办的“2018中国独角兽峰会”今日在京举行,云知声CEO黄伟出席活动并发表主题演讲。

  黄伟在演讲中表示,我们虽然进入到IoT时代,有一个可以预见的美好未来,但是离真正落地,还有很多现实问题需要解决。其中芯片在整个IoT的进化过程中起着非常重要的作用。获得了C轮1亿美金融资后,不久前云知声推出了自研的物联网AI芯片“雨燕”。

  谈及AI芯片的制造,黄伟认为只有具备全栈式的AI技术能力、已经经过验证的、成熟的业务场景和一定的芯片设计能力,三者结合在一起,才有可能真正的研发出一颗有竞争力的芯片。

  我有幸经历过中国互联网发展的前两个阶段。上大学时我第一次接触PC,第一次上网是毕业前去网吧,那时候打开一个网页需要几分钟,上网一个小时需要10块钱,差不多是我两天的生活费。2009年我离开服务了六年的公司摩托罗拉,加入盛大网络,从学生到工程师,完成了我人生的第一个转变。那是中国PC互联网的一个高峰。

  紧接着从2010年开始,我们经历了中国从PC互联网到Mobile时代。我们看到中国第一代互联网公司的市值从10亿美金左右,翻到Mobile时代的阿里、腾讯的几千亿美金。我们也经历了苹果从一个80亿美金的市值,到今天为止也成长为大几千亿美金的公司。

  这期间发生了什么?以前全球只有几亿台的设备数量,到现在每个人有一台手机、Pad,可能有几十亿台移动联网设备。以前我们只能在办公室、家,甚至只能在网吧上网、打游戏,今天我们坐在马桶上就可以完成一个游戏的支付,这种设备数量以及移动的发展,使得今天我们整个生活方式和社会组织方式都发生了深刻的变革。

  今天在发生什么?我们又开始从Mobile时代开始进入IoT时代,它不再局限于手机、平板,比如像前面暴风冯总介绍的,TV也可以上网、互动。甚至你们家的灯泡、音箱都是你跟这个数字世界进行交互的一个接口。

  我们也不再只是通过手机的按键输入,而是完全可以直接说话,可以对着摄像头做出一些交互的操作。从一个数控时代,开始进入到包括了语音、手势、体感等多模态的交互的任意场景。当然和以前相比,设备数量可能会更大,我们相信这个地球上很快会诞生万亿美金的公司,即使在今天有中美贸易战的情况下,这种趋势还是不可逆转的。

  首先,功能会更加智能化,不再只是通过手、嘴巴、眼睛等等。其次,场景化会更加丰富,不光在家、办公室、汽车等任一场景,我们都能够跟这个世界进行交互,当然设备也变得更加多元化。

  我们描述了一个非常美好、伟大的未来,但是离真正落地,还有很多现实问题需要解决。首先我们今天的技术怎么实现一种自然的交互?怎么能在这些场景里面满足用户的体验?因为每个场景必然的独特属性,我们能不能在这个场景里做非常好的适配?这些产品并非静止,也不是交付到用户手里这个过程就结束了,我们如何运营、提升用户体验?

  另一个很大的不同是价格。手机、平板动辄几千块钱以上,IoT设备本身是几百块或者是一千块钱左右,你怎么样用一种用户能够接受的方案成本交付给你的客户?当然还有周期,怎么能够用更快的时间、效率交付给客户?这都是我们今天在讲IoT想要落地,摆在眼前的几个困难。

  2014年初,我们第一次对外提出“云端芯”一体化的解决方案。因为我们相信人工智能绝对不只是发生在云端,除此之外,一定有边缘智能,而且想要渗入到每个场景,对端一定会提出很多个性化的需求。所以,我们希望通过云端来解决智能终端的一些智能化、场景化的问题。当然我们也希望通过芯片,能够加速AI落地的问题。

  前面松鼠AI智适应教育创始人栗浩洋讲他在2014年融资非常困难,其实我相信在中国所有技术创业的团队一开始都会遇到这种问题。因为2012年、2013年,那时候的资本都在投APP、产品创新,没有人去投技术。所以很早之前,当我们说人工智能离不开芯片的时候,也遇到很多挑战和置疑,大家不认为芯片非常非常重要。甚至我记得在2016年,中国有很多资本在国外收购芯片公司,我们说芯片是高端制造业,芯片是西洋产业,但今天我们会发现没有芯片我们什么都不是。

  今天回过头来看,人工智能真正落地,它的痛点是在哪里?没有英伟达就没有深度学习,没有英伟达提供的GPU,我们不可能开发出非常复杂的深度学习网络,没有一些低成本、低功耗的芯片,我们不可能赋予智能设备一些本地职能能力,所以芯片在整个IoT的进化过程中起着非常重要的作用。

  在我们的认知里,AIoT的扩基点在于芯片,首先在于场景的选择。因为IoT有很多场景,选择就变得非常有技巧,哪些场景是用户真正需要的,哪些场景是今天我们的技术能力满足需要的。

  第二,有了场景以后,我们就知道这个场景需要什么能力,我们应该提供什么样的芯片,当然有了芯片以后其实我们可以加速AI在这个场景里落地,其实他是一种正向的循环。AI芯片也并不是说今天有PPT,明天芯片就能做出来,或者说今天开个发布会,6月以后我的芯片就出来了。毫无疑问,做任何事情都是有前提的,过去几年我们的体会是什么呢?AI芯片的制造有3个前提:

  只有当三者合在一起的时候,那么我们才有可能真正的研发出一颗有竞争力的芯片。从2012年6月份成立,云知声在这一块也积累了一些优势。一开始我们完成了算法平台化的过程。成立了3个月之后,我们发布了国内第一个免费开放的语音平台,紧着在2012年12月12号,我们买了4个英伟达的语音显卡。在可能学术界95%的教授都没有听说过什么叫深度学习的时候,我们在2012年就已经开始了。

  今年回过头来看,这三件事情非常重要。平台意味着数据,深度学习意味着我们确定了整个算法的框架,当时一个很简陋的GPU,意味着我们在那时就开始了对计算能力的追求,到今天我们的计算能力已经超过100个GPU。

  这是我们第一个阶段。另外,在发展过程中我们发现,人工智能对计算能力的追求是永无止境的。今天我们可能说自己研发机房的GPU已经是以千个GPU为单位,包括我们在厦门市政府落地的一个城市大脑的创造平台,每秒的计算能力能达到1亿次计算,这就是我们金字塔最底层的DeepFlow集群,它相当于给我们人工智能修了一条高速公路。

  那么有高速公路之后,我们会面临另外一个挑战。就像前面冯总说的,电视数据化看起来很简单,其实上面涉及到很多环节,包括信号处理、包括麦克风、语音识别、自然语言理解、语音合成,包括像前面我们主持人和机器人的对话,它通过一种高表现力的合成效果把声音播放出来。

  其实当你每个方向都在深度学习,你会发现这在2012年、2013年是不可能现实的。那我们怎么办呢?很简单,运用AI来做AI人才该做的事情。所以,我们在2013年启动了一个项目叫Atlas平台,把统计学习和深度学习里面的一些通用算法抽样出来。云知声有自己的DeepFlow集群,相当于在高速公路上有一台马力非常强劲的跑车。在这个时代,你有高速公路,有很好的跑车,你不需要很多司机。正是这样,云知声作为一个创业公司,才能非常高效地在语音识别、语音合成等很多技术里,迅速做出国内最顶尖的技术水平,这是我们在一些基础技术上的积累。

  云知声比较早的把这个技术深入到场景里面去。我们有什么产品形态?举个例子,在2013年底、2014年初的时候,我们开始拿出一个芯片模组的原型,希望能用这种产品形态改变今天智能家居的一个应用模式。大家回想一下,在2013年底,其实我们看不到echo,它是在2014年底才出来,但我们在那个时候就开始做这样的事情,到今天我们的芯片模组几乎应用在中国所有的顶级家电产品中。

  所以,在算法、硬件以及场景层面,我们做了非常具体的工作和长期的积累。2015年8月,我们组建了芯片团队。到今年1月15号,我们自己研发的芯片正式流片,5月16号正式发布了芯片“雨燕”,下个月即将大规模量产。

  有了芯片之后,给我们带来了哪些改变?我们的计算能力是目前市面上通用芯片的50倍以上,而且在端这一侧积累了很多能力之后,我们可以把一些人机交互的共性部分放到芯片里面,不光是语音合成、语音识别,甚至包含我们认为非常复杂的自然语言理解,相当于我们完成了人机交互的最共用部分。

  那么,云端我们去对接的各种技术服务和内容服务等等,在端这一侧,我们完全把源代码开放出来,交给我们的合作伙伴,交给渠道,这样云知声我们就完全进入了“云+芯”时代。在不久的将来,大家会看到我们中国产的车里面,我们用的芯片里面,是由云知声提供。

  我们为什么做这个芯片?有一句话是说,“装一个软件,就为它设计一个硬件。”最底层的硬件是什么?就是芯片,因为它能够实现算法和算力的完美结合。当然芯片它其实并不是竞争,不是一味的追求说我这个芯片有多少,不是的,芯片它是个生态,追求的是一种平衡,你要平衡好计算能力、成本、功耗,只有深入场景,了解行业,才能够真正定义好这个芯片。

  我们今年是百箱大战,但是所有的音箱里面,它里面所用到的和远场语音交互的,都是一套模组,要用若干个芯片来实现这样的功能。

  第一,今天云知声可以用一个芯片接上2个、4个、6个、8个麦克风,就能实现我们今天所有的功能,体验会更好,因为这个芯片的计算能力要远远超过今天市面上一些芯片的计算能力。

  第二,更低的成本、更低的功耗。当然这个芯片我们也可以直接放在一些控制类上面,它既可以离线控制,也可以在线。

  我们不止是讲个故事,也不是说停留在算法层面上,而是把算法和行业结合在一起。比如在教育、在医疗、汽车、智能家居、机器人很多领域里,其实我们都取得了一些不错的成绩。

  就拿医疗来说。2015年,当我们想把AI和医疗结合起来的时候,中国的任何一家医院,任何一个科室,没有一个医生是用声音来写病例,但是今天我们在中国很多医院,包括像今年卫计委还专门出台了文件,我们中国所有三甲医院的评级标准是必须要有这个语音录入的病例。

  我们非常高兴能看到,云知声虽然是一家创业公司,但是通过我们的努力,我们改变了医院,改变了行业,我们甚至促定了标准的制定。

您可能还会对下面的文章感兴趣: