边缘AI,具身智能和空间智能的终局:比特驱动原子的实体AI
来源 | 物联网智库2024-06-27 14:22:42
随着英伟达公司市值在上周短暂登顶全球之首,一个大变革的时代正在愈演愈烈。纵观股市发展历史,我们可以发现一个有趣的规律:每当一家公司跃升为全球市值冠军,往往预示着其所处行业将引领未来十年甚至更长时期的经

随着英伟达公司市值在上周短暂登顶全球之首,一个大变革的时代正在愈演愈烈。

纵观股市发展历史,我们可以发现一个有趣的规律:每当一家公司跃升为全球市值冠军,往往预示着其所处行业将引领未来十年甚至更长时期的经济增长。这些巨头的崛起,犹如一座座时代的灯塔,照亮了产业变革的航道。

而此时此刻,随着生成式人工智能(Generative AI)的日新月异,AI正悄然走向下一个前沿阵地——比特与原子的交汇点。

英伟达,作为最早洞察这一趋势的科技巨擘,敏锐地提出了AI发展的新重心:从生成式AI转向实体AI(Physical AI)。这意味着,AI系统将不再局限于虚拟世界的创造,而是要深入理解现实世界的物理法则与复杂环境,进而推动自动化服务机器人的加速普及。

英伟达近期还趁热打铁,发布了AI Enterprise-IGX平台和Omniverse微服务,以提升AI在边缘环境中的大规模部署能力,为实体AI的发展铺平道路。

与此同时,苹果公司在最新的WWDC大会上也抛出了重磅发布:Apple Intelligence。这个全新的AI架构最吸引眼球的,莫过于其边缘和云端混合的组合模型,以及端到端加密的隐私计算技术。在这种设计下,每位iCloud用户都能拥有独一无二的个性化模型,实现基础模型与用户同步进化。苹果正巧妙利用自身在移动终端的优势,弥补在大语言模型领域的后发劣势。

实体AI这个概念,源自英国帝国理工学院研究人员的创见,并被投资机构Coatue纳入其最新的AI四阶段S曲线发展图。

这四个阶段分别是:AI基础架构、边缘AI、AI应用和实体AI。每个阶段都呈现出独特的投资机遇和挑战。

  1. AI基础架构:已进入第二轮角逐。当前数据中心内与AI相关的服务器仅占9%,但终将增长至90%;AI耗电量仅2%,云平台AI模型收入占比才3%。竞赛方兴未艾,但基础架构已是AI投资最成熟的赛道。

  2. 边缘AI尚处概念炒作阶段。Coatue将AI手机和AI PC划归此类。随着拥有海量用户的苹果杀入AI市场,谷歌和苹果的角力将更趋白热化。

  3. AI应用:百花齐放的早春时节,投资风险不小。软件巨头凭借既有用户基础进场占优,初创公司则压力山大。

  4. 实体AI我们正处于一个独特的时间节点。得益于强化学习、计算机视觉和大模型(LLM/VLM)的长足进步,诸多昔日不可能的工业应用场景,现已近在咫尺。譬如:以最少人工干预,实现新型材料的闭环预测、模拟、生产与测试;研发在偏远沙漠布设太阳能板的机器人,效率比人工高1000倍;应用自主控制,大幅提升水泥、化工等高耗能工业流程的管理效率;利用自主工厂,将制造成本高企的产品生产线迁回国内。未来5-10年,人工智能必将彻底重塑我们的物理世界。

当前,AI基础设施的竞赛已如火如荼,而实体AI的角逐才刚刚起步。

要为用户带来流畅的智能体验,必须实现软硬兼施。在这个快速迭代的智能时代,传统的应用开发模式面临巨大挑战。我们也许根本无需开发应用,只需通过各种硬件和自然对话交互,以端到端的方式为用户解决问题。因为,这是一场远超互联网和移动时代的新工业革命。

今天,让我们一起探寻比特与原子的交汇点,揭秘实体AI的机遇与挑战。

实体AI:比特如何驱动原子

什么是实体AI

实体人工智能(Embodied AI)是人工智能技术的一个新兴分支,旨在解决与物理世界直接交互的问题。不同于传统的人工智能系统,如金融推荐系统、聊天机器人或智能游戏,实体人工智能系统能够通过传感器感知周围的环境,并通过执行器对环境进行操作和改变。

实体人工智能的一个显著特点是,它需要处理来自真实世界的海量异构数据,这些数据往往具有不确定性和不完整性。同时,实体人工智能系统的行为结果也存在一定的不确定性,因为它们所处的环境是复杂多变的,并且往往需要与人类共享环境。因此,如何在不确定环境中做出智能决策,是实体人工智能面临的一大挑战。

以机器人领域为例,目前的机器人在“智能”程度上存在很大差异。

传统的工业机器人主要执行高度重复的任务,很少需要与环境和人类交互。而服务机器人则需要大量的传感器来感知环境,如导航、抓取物体、识别人脸等,同时它们的行为结果也不那么确定。这些服务机器人是实体人工智能的典型代表,它们需要更高级的智能来应对复杂多变的现实世界。

但实体人工智能的应用远不止机器人。

我们可以设想一个智慧城市的场景,通过在公共设施上安装大量微型传感器,来实时监测城市的污染水平。人工智能算法可以融合这些传感器数据,精确预测污染的分布情况。同时,算法还可以主动控制传感器的移动路径,引导它们到达信息量最大的区域。

更进一步,系统还可以通过城市摄像头识别移动污染源(如车辆),从公开渠道挖掘其他污染源的信息。最后,这个物理数据驱动的智慧系统可以对城市居民和管理部门提供两方面的决策支持:一是向居民推荐避开高污染区域的路线,二是控制交通引导,合理疏散和分流人群。这个场景展现了实体人工智能融合物理世界数据,实现智能感知、决策与控制的巨大潜力。

当前,我们正处于一个人工智能蓬勃发展的时代。得益于机器学习算法的进步,以及算力、数据的积累,许多以前看似不可能的任务正在被逐一攻克。

未来5到10年,人工智能有望在先进制造、智能电网、自动驾驶等领域得到大规模应用,彻底改变我们的物理世界。而实体人工智能作为连接虚拟与现实的桥梁,必将在这场智能革命中扮演关键角色。

实体AI:创新重心的大迁移

在人工智能的浪潮中,边缘智能、具身智能和空间智能如三股清流,渐渐汇聚成实体智能(Physical AI)的洪流。

这是一场从虚拟走向现实、从抽象走向具象的壮丽跃迁,预示着人工智能正全面渗透并重塑我们的物理世界。

边缘智能力图将AI算力从云端下放至边缘设备,让智能在数据源头就能实时响应;具身智能则致力于将AI与机器人硬件深度融合,使其能感知、理解并操控三维空间;空间智能则探索如何用AI理解和优化人类活动的空间布局。

三者虽各有千秋,但殊途同归,无不试图打破数字与物理世界的藩篱,让AI融入现实。

这种趋同绝非偶然。当前AI的主战场仍局限于线上数据和应用,而人类生活的主要空间依然在线下。边缘、具身、空间只是实体智能的不同切入点和落地路径,其共同目标都是服务并改变物理世界。正因如此,英伟达将实体智能视为继生成式AI之后的下一个制高点,苹果也在加紧布局边云协同的“上下同欲”。

实体智能的崛起,意味着AI创新的重心正从算法回归到场景,从实验室走向产线车间、城市街道和人们的日常生活。

这对传统软件开发模式提出了挑战。单纯的云端AI恐难以应对实体世界的多样性和复杂性,开发者需要在算法、硬件、场景之间找到微妙平衡。应用也将不再是孤立的软件,而是与真实环境深度融合、持续互动的智能系统。

随着实体智能的发展,未来将不再有单一的“软件应用”,取而代之的是各种基于AI的智能服务。

工厂里的机器人、口袋中的手机、家中的智能音箱…这些智能设备将以不同形态和方式,与人类和环境展开实时互动,无缝满足人们的各种需求。这是一场数字革命,但触发点在物理;是一场工业革命,但生产力在智能。

事实上,许多企业已在探索实体智能的应用。与依靠算力的云端生成式AI之争不同,拥有最佳使用场景的企业可能将胜出。

特斯拉更新了公司的生态图,标题为“More Than Just Vehicles”,暗示他们不仅仅是造车的。特斯拉正通过其改进版本驱动Optimus机器人,马斯克在最近一次财报电话会上表示,计划今年底让Optimus在Giga factory代替人类干活。

这张图将AI Compute与软件驱动系统置于中心,构建起智能制造、能源存储、电动车、自动驾驶和人形机器人的全新生态网。很明显,这次财报已暗示了特斯拉的转型,从卷电动车的红海转向现实世界AI的新疆域。

英伟达有一个更宏大的计划,在今年GTC大会的“One More Thing”环节,他们宣布推出GR00T项目,一个通用智能体。其目标是为通用人形机器人构建基础模型,使其能在不同实体间迁移。训练过程类似OpenAI训练GPT-4,通过在海量环境中训练获得通用性。英伟达将通过它以1000倍速运行物理模拟,生成无限复杂精细的虚拟世界。

OpenAI在实体AI领域也频繁投资。今年1月,其投资的人工智能和机器人公司1X宣布推出第二代机器人NEO,这是一款双足人形机器人,旨在执行消费者家中的日常任务。最近,一家名为Physical Intelligence的新公司宣布成立,称其目标是开发AI来为“当今的机器人和未来的物理驱动设备”提供动力。

据该公司网站介绍,Physical Intelligence正处于构建基础模型和学习算法的早期阶段。其团队包括工程师、科学家、机器人专家和公司建设者,得到了OpenAI和红杉资本等知名机构的投资。

值得注意的是,该公司的目标并非为仓库或工厂中执行重复性任务的机器人提供动力,而是构建一个可用于各种应用的通用人工智能模型。Physical Intelligence不会制造硬件,他们购买不同类型的机器人来训练其软件。

Web3赋能实体AI:DePIN生态下的商业模式创新

创建一家智能机器人公司需要漫长的时间,构建任何实体都需要更大的创造力、商业头脑、时间,以及最重要的“精明的”资金。然而,我们有可能将Web3与AI结合,加速实体AI的到来,为这一过程注入新的活力。而DePIN(去中心化物理基础设施网络)正是连接Web3与实体经济的桥梁。

在DePIN生态下,实体智能的商业模式创新有望迎来新的突破。初步的实体智能应用通常采用设备销售、软件授权等相对单一的盈利方式,难以适应物联网环境下多元主体、多场景的复杂需求。而DePIN独特的token经济模型,为实体智能商业模式创新提供了新的思路和工具。

首先,DePIN通过token激励机制,可以有效调动分散在全球各地的边缘设备参与智能计算和数据共享。边缘设备提供商可以将其闲置的计算、存储资源注入DePIN网络,并以此获得token奖励。这种激励模式不仅可以显著降低实体智能的部署成本,还能促进计算资源的弹性供给和按需使用。

其次,DePIN的token经济有助于构建实体智能应用的多边市场生态。在这个生态中,边缘设备提供商、数据提供方、算法开发者、应用服务商等主体可以通过token实现价值的自由流动和交换。例如,一家智慧城市服务商可以通过DePIN购买边缘设备提供的算力,利用数据提供方提供的城市物联网数据,整合算法开发者的智能模型,从而构建全新的实时城市管理方案。

再次,DePIN的token机制为实体智能应用提供了全新的盈利渠道。一方面,实体智能服务商可以直接向用户收取token服务费,或者采用token+传统支付的组合盈利模式。另一方面,服务商还可以通过质押token参与DePIN生态治理,分享整个网络的增值收益。

最后,DePIN的token经济还将助力实体智能在垂直行业的商业模式创新。工业互联网为例,DePIN可以成为连接工厂内外的token交换平台。设备制造商、工业软件服务商、第三方数据分析机构等,可以基于token实现互信协作,共同为工业客户提供端到端的实体智能解决方案。

综上,DePIN的token经济为实体智能商业模式创新开辟了广阔空间。通过token激励资源共享、构建多边生态、拓展盈利渠道、赋能行业变革等机制,DePIN将推动实体智能走向规模化应用和产业化发展。

写在最后

实体智能的崛起,标志着人工智能正从虚拟世界走向现实,从数字空间走向物理空间。这是一场全方位的变革,将重塑我们生产和生活的方方面面。

按照投资机构Coatue的推测,我们将见证一个新物种的诞生:Humanoid。它的大脑是GPU、知识教育来自大模型、它的家就是数据中心,它的食物就是电力,而我们需要学习的是如何与Humanoid共存。