英特尔中国物联网事业部CTO张宇:元宇宙离不开AI技术的支撑
来源 | 科创板日报2022-01-12 14:17:57
AIoT,即人工智能物联网,是人工智能(AI)与物联网(IoT)在实际场景落地中相互融合的产物,作为一种新的物联网应用形态,是通往“万物智联”、“人机深度”的必经之路。当下,AIoT正被广泛应用于汽车

AIoT,即人工智能物联网,是人工智能(AI)与物联网(IoT)在实际场景落地中相互融合的产物,作为一种新的物联网应用形态,是通往 “万物智联”、“人机深度”的必经之路。

当下,AIoT正被广泛应用于汽车、零售、金融、交通等各行各业,包括目前热炒的元宇宙也离不开AIoT技术的支撑,被称为是“连接实体与虚拟世界的桥梁”。

中金公司预计,2022年人工智能与物联网的结合有望全面落地助力智慧城市、智能工厂、智能交通、智慧矿山等有望加速落地,推动ICT新基建规模落地。 但在这一轮AIoT的繁荣浪潮背后,对于其发展前景的质疑声也不绝于耳。尤其是在AI产业化方面,依然存在诸多瓶颈。

近日,英特尔物联网视频事业部全球首席技术官、物联网事业部中国区首席技术官张宇博士接受《科创板日报》采访,畅谈了对AIoT以及人工智能发展的思考。

英特尔中国物联网事业部CTO张宇

张宇认为,人工智能与物联网的结合需要经过三个阶段,AIoT发展暂时还处于第一阶段,只有当机器能根据人类的需要,进行自主学习,才能实现真正的AIoT。

在他看来,AI是一种技术,但从最终用户的角度来看,能够体验到的是服务。所有的服务都不是依靠单一的技术来支撑的,而是一系列技术的结合,以及一系列平台的支撑。

对于AIoT的应用场景,他认为2B与2C存在区别,2B对准确度的要求很高,所使用的参数会更多。在2B方面,AI在智能制造领域应用前景广泛,一方面帮助企业提高生产效率,另一方面也为碳中和、碳达峰在做相应的贡献。

谈及最近热门的元宇宙,他认为,其实AR/VR只是元宇宙的入口,但AR/VR背后所展现的内容,实际上也需要AI技术的支撑。通过AI技术来感知用户需要什么样的信息,然后把这些信息进行汇总、处理以及分析,最终让结果呈现在AR/VR的设备之上。

以下为《科创板日报》整理的专访实录:

当下的AI:50%人工 VS 50%智能

《科创板日报》:您如何看待人工智能与物联网的结合?

张宇:我觉得AI与IoT的结合分为三个阶段:

第一个阶段是AI技术在边缘侧、在推理阶段率先应用。在这个阶段还需要大量的数据中心能力,来帮助我们训练人工智能的网络模型,把推理结果推送到前端进行使用。

第二个阶段是边缘训练阶段。如果始终利用数据中心进行模型训练,不可避免地会造成训练时间比较长,模型更新频率比较慢。

随着物联网的发展,以及数字化转型的推进,及时地、在更短的时间得到一个网络模型更新的需求,会越来越强。所以我们认为,日后训练工作会慢慢从数据中心迁移到边缘。在边缘可以利用动态采集到的新数据,来进行模型的二次更新,利用更新的结果来指导下一步的操作。

第三个阶段是自主学习的阶段。现在人工智能存在很多的局限。之前跟很多专家交流的时候,我经常会开一个玩笑:从人工智能的字面上来看,既有“人工”的部分也有“智能”的部分。这也很好地体现出目前人工智能的使用模式——大概有50%是人工的,另外50%是智能的、利用机器所产生的。

《科创板日报》:当下,人工智能还是脱离不了人的支持,这会带来哪些阻碍?

张宇:如今人工智能使用过程当中,人仍然扮演着非常重要的角色。虽然我们可以利用庞大的算力来训练模型,但是模型结构还是要由人来训练和设计。这就导致,AI模型在设计过程之中,已经加入了很多人的意志

而且这个模型的结构一旦定了,其应用场景也会比较固定。比如,某一个模型可能适合做视频处理,那么同样的模型就不太适合做自然语言处理。因为早在人进行模型设计时,限制就已经造成了。

所以,我们需要进入第三个阶段,这实际上是一个自主学习、自主训练的过程,称之为Auto Machine learning。简单来说,是机器根据人类的需要,自主使用相应的数据来设计和训练模型,再把这个模型运用到最终的推理过程中。

从今后的发展来看,尤其在数字化转型中,越来越需要这种能够感知人类意图的机器。它们可以根据使用者、最终用户的意图来主动地自我调配,选择适宜的网络模型、数据结构,从而得到最适宜处理当前场景的模型,并把模型发送到前端来进行相应的工作。

AI本身是技术 用户体验到的是服务

《科创板日报》:当下我们处于AIoT发展的哪个阶段?

张宇:暂时还处于第一阶段,对第二阶段还在探索中。因为算力和数据是两大挑战。比如在物联网的边缘端,如何来标注数据,是亟待解决的。

《科创板日报》:能否具体谈谈AIoT落地的挑战?

张宇:首先随着AI应用越来越多,对于AI的效果以及即时性要求也越来越强。如何保证大量的AI数据能够及时处理,是一大问题。现在有一些解决办法,比如边缘计算正越来越兴起,把AI的处理工作放在边缘来进行操作,从而更好地响应用户的需求

第二,现在有越来越多AI的不同框架、不同的计算平台以及不同的应用场景。在这种碎片化的场景,开发者如何拥有一个更好的开发工具,能利用这个工具找到最适宜的使用场景的关键API也好、适宜的硬件平台也好,可以让想法快速落地。这些开发工具也是一个很大的挑战。

我们看到百度推出了PaddlePaddle,英特尔推出了OpenVINO,通过这样一些工具的结合,能够让开发者从构建、优化到最后的部署都有一整套的开发工具,帮助其更快实现想法的落地。

三是生态方面的挑战。AI是一种技术,但从最终用户的角度来看,能够体验到的是服务。所有的服务都不是依靠单一的技术来支撑的,而是一系列技术的结合,以及一系列平台的支撑。

所以就需要在整个AIoT产业链的各个环节,包括开发者、服务提供商、芯片提供商以及硬件的OEM、ODM,以及软件的ISV等等,大家一起合作,来构建一个完整的服务平台。通过这样一个服务平台,使得最终用户切身感受到基于AI的这种应景、实时的服务。但是,如何构建这样一个产业链,打通产业链的各个环节,这存在很大的挑战。

AI芯片落地需要生态圈合力

《科创板日报》:目前AI芯片初创公司的产品落地难点,是否也在生态上?

张宇:一方面由于AI芯片的研发投入很大,比如芯片流片的成本很高;另一方面在于生态系统。因为芯片光有硬件不行,要有软件,还需要与应用结合起来。AI芯片落地不可能只依靠一家公司来完成,需要生态圈一起合力

比如做芯片的企业,需要软件伙伴来帮其做软件解决方案、软件工具,从而配合硬件一起推给用户,这是产业链协同来完成的,光靠一家很难做成。

《科创板日报》:你看到的AIoT当下有哪些应用场景?

张宇:其实这方面的应用很多,总的来说可以分为两大类,一类是2B的应用,一类是2C的应用。

在2C的应用方面,像手机上的美颜,或者大家在购物的时候,电商平台会给你主动推送可能需要、也可能不需要的商品,其实这些都是人工智能技术的应用。

包括最近热门的元宇宙,其实AR/VR只是元宇宙的入口,但AR/VR背后所展现的内容,实际上也需要AI技术的支撑。通过AI技术来感知用户需要什么样的信息,然后把这些信息进行汇总、处理以及分析,最终让结果呈现在AR/VR的设备之上。

在2B方面,我们看到AI在智能制造领域得到了越来越广泛的应用。比如在边缘端,可以进行AI缺陷监测,及时在生产线上发现有瑕疵的半成品,并第一时间剔除出来。这样,一方面帮助企业提高生产效率,另一方面也为碳中和、碳达峰在做相应的贡献,这些都是AI在2B的场景里的具体应用。

《科创板日报》:2B和2C在要求上有哪些不同?

张宇:2B与2C最大的区别在于,2B对准确度的要求很高。举个例子,个人手机上使用的智能美颜功能,即使美颜出错了也无伤大雅。而2B业务如果出了错,会导致成本消耗、产品的损失。此外,B端的应用场景也更复杂。

比如, 2021年我们在奥迪的一家德国工厂落地人工智能。那家工厂里有2500台机器人,其中有1000台是焊接机器人,均用于奥迪的汽车制造。

一辆汽车有多达5000个焊点。奥迪通过焊接机器人来分析每一个焊点的质量,包括通过的电流情况、焊枪的位置等等。把这些信息综合起来,判断当前焊点的质量是好、还是不好,这里是利用了一整套人工智能的算法来完成的。

可以想象,如果5000个焊点里只要有一个出错,那么这辆车就废了。所以B端要求跟C端是不同的,而且算法更难,所使用的参数会更多。

底层架构与数据能力提升是关键

《科创板日报》:人工智能的概念最早在五、六十年代就已提出,目前经过了三轮浪潮的发展,您认为影响其发展的要素有哪些?

张宇:我们今天虽然谈的更多的是AI本身,但是AI实现的背后离不开计算,也离不开数据,而数据的获取离不开数据的传输和数据的存储。

从AI的发展来看,目前这一轮人工智能高潮的起点是2012年。上一轮人工智能的高潮是上世纪90年代。如果我们把上世纪90年代的技术和这一轮的技术做对比的话,可以看到,不管计算也好,通讯也好,存储也好,三者的能力超过百万倍以上的提升。

所以,卷积神经网络是推动人工智能发展最关键的要素吗?我认为并不是。

因为在上世纪90年代,卷积神经网络就已经出现。当时,人工智能三巨头之一LeCun,在贝尔实验室工作的时候,设计了卷积神经网络来做OCR的处理。这并不是一个新的技术。和上世纪90年代相比,真正推动本轮人工智能高速发展的,由于这些底层基础架构、数据能力方面的提升。

当然,英特尔也在其中扮演了一个很重要的角色。在2021年的下半年刚刚颁布的全球超级计算机500强的榜单当中,有80%以上的超级计算机使用的是英特尔的产品。我们希望帮助用户搭建一个端到端、带有AI能力的训练和推理的平台,能够涵盖数据从采集、计算、存储、传输的所有流程,来推动人工智能的应用更快落地。