商汤科技：通用智能拓展智能汽车边界

作者 | 商汤科技2021-12-22

智能汽车正在从传统的“制造”到“制造+服务”模式转变。它将连接城市和个人，在个人消费、城市管理和企业服务方面，都有着非常大的想象空间。

近日，在2021世界智能汽车大会上，商汤科技联合创始人、移动智能事业群总裁王晓刚教授发表主题演讲《通用智能拓展智能汽车边界》。

他指出，通用智能不仅可以解决大量的长尾问题，还能够不断丰富智能汽车的应用场景。商汤致力打造的SenseCore商汤AI大装置，正通过超级算力和超大模型，为智能汽车构建通用智能的能力，推动智能汽车与各个产业相互融合，不断创新驾乘体验。

商汤科技联合创始人、移动智能事业群总裁王晓刚教授

以下为王晓刚教授演讲内容，整理分享给大家：

非常荣幸今天能有机会与大家分享未来人工智能发展的一个重要趋势——通用智能如何打破智能汽车的边界。

智能汽车正在从传统的“制造”到“制造+服务”模式转变。它将连接城市和个人，因此在个人消费、城市管理和企业服务方面，都有着非常大的想象空间。

我们知道，人工智能有三大要素：算力、算法和数据。

从算力的角度看，智能汽车的算力是智慧城市视觉感知终端算力的百倍，是智能手机的几十倍。

《通用智能拓展智能汽车边界》

由于汽车处于移动状态，其产生的感知数据无论在数据体量还是数据质量方面，都远高于其他领域。智能汽车就是一个巨大的、移动的数据生产源，关键是如何通过人工智能算法去挖掘这些数据背后的价值，我们认为有四类人工智能的模型：

第一类是智能感知模型。车载会产生大量的视频、图像，还有3D的非结构化数据，需要通过智能的感知将这些数据高效地进行结构化。

第二类是决策智能。数据结构化之后，需要更好地去做决策，包括更好地完成人机交互。

第三类是智能内容生成。人工智能、增强现实、混合现实技术的发展为我们的物理世界打造了一个平行的虚拟世界。智能内容生成能够为虚拟世界高效地生成大量内容，让虚拟世界更加精彩。

第四类是智能内容增强。在高速运动、极暗等各种极端情况下，仍能得到高质量的图像和视频，也是人工智能模型能给数据带来的价值。

▎通用智能拓展智能汽车边界

通过人工智能拓展智能汽车的边界，需要解决两方面的问题：

第一，需要解决大量的长尾问题。比如在智能驾驶的过程中，有很多场景出现的频次很低，也没有大数据的支撑去做训练，但是一旦出现其产生的后果会非常严重。未来，不同汽车智能驾驶功能的差异化，就在于谁能够去解决更多的长尾问题，满足消费者更好的体验。

第二，要不断丰富智能汽车的应用场景。比如智能驾驶中，从高速路自动巡航，到普通城区中的自动驾驶，从有高精地图到没有高精地图覆盖的广大区域;在智能车舱中，从驾驶员感知到对老人、儿童、宠物的关爱，再到智慧健康功能的应用;又如智能汽车和城市的元宇宙、增强现实、混合现实应用的融合;再如多模交互，通过基于视觉的姿态、表情、唇语的识别和语音以及自然语言理解相结合，带来更好的人机交互新体验。

随着智能汽车对人工智能的功能和需求不断提高，场景不断丰富，也就对通用人工智能提出了要求。

不同于以往的单一智能，单个AI模型输入的数据类型是单一的，只能完成单一任务、适应单一场景，利用通用人工智能技术，一个模型能够输入语音、图像、文字，还有激光雷达的3D点云等多种类型的数据，并完成各种各样的任务。

《通用智能拓展智能汽车边界》