作者:彭昭(智次方创始人、云和资本联合创始合伙人)
这是我的第353篇专栏文章。
智能代理(AI Agents)似乎成为了OpenAI的下一张“王牌”。根据彭博社的报道,OpenAI口中代表AGI通用人工智能第3阶段的智能代理,将于2025年1月发布。
OpenAI的CEO Sam Altman在最近一次访谈中提到:“智能代理将是AI发展的重要方向,它可以让AI系统像人类一样完成复杂任务。”
毫无疑问,智能代理是2025年确定的热点,Anthropic、谷歌、微软等公司已经纷纷介入。
另外我们还需要关注到,未来AI的真正风口可能并不在软件行业,而是在硬件行业,特别是消费级AI硬件的兴起。
事实上,以OpenAI为代表的生成式AI企业,正在积极地向物理世界扩展。
与虚拟世界的大型语言模型不同,这些AI硬件并不需要强大的计算能力,而是通过端侧小模型实现特定任务的智能代理功能。
尽管目前小模型在物理世界的应用还处于起步阶段,但其潜力不容小觑。相比软件领域,硬件领域的AI应用往往更加贴近用户需求,能够解决人们在日常生活中的实际痛点。
这些智能代理不仅能够感知环境、做出决策,还能够主动与世界互动,甚至参与经济活动。这种全新的AI形态,有望在未来彻底改变我们的生活和工作方式。
随着智能代理的发展,我们有理由相信,万物智能AIoT 2.0的时代正在加速到来。
在这个“万物经济”的时代,智能设备不再仅仅是数据的生产者,而是能够主动参与交易。无论是实体智能硬件,还是虚拟智能代理,都有可能自行发生交易,甚至参与复杂的经济决策过程。
在本文中,我们将深入探讨智能代理在虚拟世界和物理世界的发展趋势,并分析其对于推动万物经济发展的意义。
作为AI行业的领导者,OpenAI正在一步步推进AGI的发展,并将智能代理列为实现AGI的第3阶段。同时,该公司制定了明确的发布时间:2025年1月。
据彭博社报道,OpenAI正准备发布一款名为Operator的自主智能代理,该代理能够控制计算机并独立执行任务。该公司计划于1月份首次将其作为研究预览版和开发工具亮相。
在此之前,AI领域的另一主要参与者Anthropic已经推出了自己的智能代理功能:Computer Use。这款智能代理用途广泛,例如有用户使用它规划出行线路,如下图所示。
谷歌也没有落后,DeepMind部门最近发布了名为Project Mariner的研究模型,这是谷歌首个能够在网页上执行操作的AI代理。此外,为了帮助合作伙伴和开发者在商业化智能代理上取得成功,Google Cloud还发布了一系列激励计划。
由于众多巨头都参与了竞争,目前还不清楚OpenAI的Operator是否会比竞争对手具有显著优势。但毫无疑问,智能代理将成为生成式AI的下一步发展重点。
根据彭博社的描述,OpenAI将AI的能力分为5个阶段:聊天机器人、推理者、智能代理、创新者和组织建设者。
第1阶段:Chatbots聊天机器人,可以用自然语言进行流畅的对话;第2阶段:Reasoners推理者,AI能够在广泛的领域进行“人类博士水平的问题解决”,而不是特定于一两个任务;第3阶段:Agents智能代理,AI开始具备在没有人类输入的情况下创建内容或执行操作的能力,或者至少在人类的指导下执行;第4阶段:Innovators创新者,AI变得更具创新性,能够做“辅助发明”,而不仅仅是从已有的知识中汲取;第5阶段:Organizations组织建设者,AI模型能够在没有人类干预的情况下独立运行整个组织,此时则达到了AGI的水平。
OpenAI认为,目前的AI模型正处于第一阶段,即将进入第二阶段“推理者”,而迈向的第三阶段正是智能代理。
人工智能代理的核心是自主和自治软件,可以规划、执行任务并实现特定目标,无需人工干预。那么,人工智能代理与我们在互联网上常见的聊天机器人有何不同呢?
智能代理的核心特征使其成为连接人工智能与区块链技术的桥梁,从根本上颠覆了传统智能系统的功能和定位。相较于传统AI系统,智能代理具有以下突出特点:
1、自治能力智能代理的自主性是其最显著的特征之一。与需要明确指令的传统工具型AI不同,智能代理可以独立感知环境并采取相应行动。通过强化学习和行为规划等技术,智能代理可以根据当前数据或输入自动做出决策。
2、反应性反应性是指智能代理对外界环境变化快速响应的能力。通过先进的感知系统,智能代理可以实时捕捉环境变化并快速调整行为。
3、学习能力智能代理的学习能力体现在不断适应和优化自身行为的能力。通过整合深度学习和强化学习技术,智能代理可以根据环境反馈提高决策的准确性和效率。
4、社交能力这种社交能力的核心在于去中心化网络中的智能协作。社交能力的增强也为智能代理在元宇宙和现实世界中的应用提供了广阔的可能性。
这些特点使智能代理能够独立感知环境、快速响应变化、不断学习优化,并与其他智能代理或用户高效协作。
根据研究机构的预测,到2030年,智能代理的市场规模将达到471亿美元,复合年增长率为45.1%。这表明智能代理的兴起才刚刚开始,随着这些工具的发展,它们可能会彻底改变家居、出行、客户服务、医疗保健、教育等行业。
想象一下,在未来的世界里,你不必花时间管理电子邮件或研究任务,因为你的人工智能助手会替你处理。智能代理的应用可能性无穷无尽。
值得注意的是,智能代理的商业应用并不局限于虚拟领域,而是延伸到了实体世界。
OpenAI等公司始终坚持在物理世界进行探索,近年来持续投资与其技术路线相符的初创公司,如机器人公司Figure、1X Technologies以及Physical Intelligence。
这三家公司各有特色:1X Technologies发布的最新双足人形机器人原型一度被网友质疑是真人扮演;Figure AI发布的第二代人形机器人Figure 02被称为“全世界最先进的AI硬件”。
Figure和1X Technologies虽然均属人形机器人公司,但是路线差异较大。1x将其机器人直接带入人们的家中,旨在彻底改变家庭生活,而Figure则专注于工业应用,如汽车制造,以提高效率和安全性。除了市场方法之外,这两家公司在技术上也有所不同:1x采用基于肌腱的机器人,而Figure仅依靠执行器。
Physical Intelligence则致力于将通用人工智能技术应用于物理世界,目前正开发能够驱动当前机器人技术及未来物理设备的基础模型和学习算法。
在OpenAI的最新一轮融资中,软银的孙正义显然看到了智能代理在物理世界应用的一些端倪。他认为,在不久的将来,人工智能技术将覆盖整个家庭,智能代理可以实现健康状况监测、主动呼叫医生、执行日常购物、完成各种预约任务以及辅导幼儿等功能。
AI技术的发展具有多维度影响,特别是在硬件领域蕴藏着巨大潜力。未来AI的真正风口可能并不在软件行业,而是在硬件行业,尤其是消费级AI硬件的兴起,可能会成为下一波创新浪潮的核心。
虽然当下AI技术的热潮主要集中在软件领域,但真正的突破可能会发生在硬件领域。消费者不仅需要AI软件提供的智能服务,更需要这些服务能够通过硬件产品的物理形态融入到日常生活中。
AI驱动的家庭机器人、智能家居设备等例子表明,这些消费级硬件将成为AI技术走进千家万户的关键。
最近市场上出现了许多创新产品,如百度推出的小度AI眼镜,据说其中搭载了端侧模型。在教育类硬件中,也嵌入了一些小型模型,甚至是特别小的模型,如翻译笔、词典笔,甚至耳机等。以前我们认为这些设备太小、算力太弱,无法运行小模型,但现在有些厂商已经将特别小的语言模型集成进去。
未来,我们可能会看到更多可以与家庭成员互动的智能设备,它们能够根据用户需求提供个性化服务,并不断学习和进化。这些创新产品不仅是技术的展示,更是实用性的提升,能够真正解决日常生活中的痛点。
AI消费级硬件创新可能正是许多企业忽视的“蓝海”。与软件应用相比,硬件创新面临的技术壁垒和市场挑战要大得多,但也因此蕴藏着更大的机会。如果能够突破这些壁垒,开发出具有高度实用性的产品,便有可能引领下一个技术潮流。
端侧有很多这样的例子,特别是一些嵌入式设备已经能够运行小型模型。未来,我们会发现越来越多的端侧设备,如眼镜、手机、PC等,将内置越来越多的小模型,它们将无声地影响着我们的生活。
随着人工智能技术的不断进步,智能代理将成为推动万物经济发展的关键力量。
智能代理不仅能够自主感知环境、做出决策,更重要的是,它们能够主动参与数据交易,为商业化应用提供新的可能性。
在万物经济时代,智能设备不再仅仅是数据的生产者,而是能够根据自身需求和目标,自主地参与数据交易。这种交易可以是设备之间的直接交易,也可以是设备与其他经济主体之间的交易。智能代理正是实现这一愿景的关键所在。
然而,智能代理距离真正可用还有诸多挑战需要克服。作为新型生产力,智能代理需要搭配Web3这种新型生产关系,才能真正进入大众视野。
智能代理需要成为独立个体,拥有独立的财务账户,可以自主执行任务。如果我们希望智能代理可以自主执行任务,那么其必然需要一个自主“身份”,作为一个独立个体存在。在Web3中,为智能代理注册一个链上身份和链上钱包,是非常自然而然的事情。
通过赋予智能代理自助交易的能力,我们可以构建一个高度自动化、高效运转的经济系统。在这个系统中,智能代理可以根据自身的任务和目标,自主选择交易对象,谈判交易条件,并完成交易过程。这不仅可以大大提高经济活动的效率,还可以促进资源的优化配置,推动商业模式的创新。
举个例子,假设一个智能代理控制的自动驾驶汽车在行驶过程中发现自己的电量不足,它可以自主寻找附近的充电桩,并与之进行交易,支付相应的费用来获取电力。这整个过程无需人工干预,完全由智能代理自主完成。类似的场景在万物互联的未来将变得司空见惯。
当然,要实现这一愿景,还需要在技术、法律、伦理等多个层面进行探索和完善。我们需要开发更加智能、更加安全的智能代理,建立健全的数据交易机制和规范,确保交易过程的公平、透明和可信。同时,我们也要重视智能代理的伦理问题,确保其行为符合人类社会的价值观和道德准则。
相关公司已经开展了很多探索。比如,Fetch.ai与博世公司正在使用智能代理AI创建能源社区,用户可以在其中共同管理、共享和交易可再生能源。
智能代理实时监控能源生产和消耗,动态分配资源,确保能源得到最佳共享,从而最大限度地减少浪费并提高成本效率。社区成员通过分散的P2P市场交易剩余能源,由智能代理确保最佳交易并通过智能合约实现交易自动化。该解决方案可降低社区的能源成本,通过本地能源生产提高恢复能力,并减少碳排放,使可再生能源更易于获得,并为所有人带来回报。
沃达丰与住友公司合作创建了Pairpoint,这是一个允许设备使用由移动SIM卡和区块链保护的钱包和支付技术进行无缝、安全的交易的平台。
例如,平台可以允许电动汽车直接连接充电站并协商充电金额和费用;汽车可以与交通管制系统进行交易以获取有关当地交通流量和拥堵的信息;或者货运集装箱可以向港口当局提供他们在出口商、进口商或货运承运人之间交换货物所需的所有信息。
除了安全自动支付的便利性之外,万物经济还将开启需求方直接响应的可能性。
从汽车、公交、火车到航运、能源和零售,机遇远不止电动汽车和充电站之间的交易,还可以直接通过车辆支付过路费和停车费,而使用公共交通的旅客可能不必提前付款或刷卡进出。
在航运领域,贸易公司不仅能够追踪其产品,还可以向海关核实集装箱和包裹内容,并自动支付所有应缴关税。
在家里,家庭可以授权太阳能发电机根据需求自动向电网出售多余的能源。在街上,零售商可以调整价格,在非高峰时段为购物者提供实时折扣。
总之,智能代理自助交易的实现,将标志着万物经济发展进入一个崭新的阶段。
智能代理和Web3的结合,正在为万物经济打开一扇通往未来的大门。
随着技术的不断进步和应用场景的不断拓展,我们有理由相信,这两大热点的碰撞将释放出前所未有的能量,推动人类社会迈向一个全新的智能时代。
在这个时代,每一个物体都将拥有自己的智能代理,它们能够自主学习、自主决策、自主交易,与人类形成更加紧密、更加高效的协作关系。这不仅将极大地提升生产力和资源配置效率,还将从根本上重塑我们的经济形态和社会结构。
参考资料:
Crypto x AI Agents:互联网新范式的最后一块拼图,作者:starzq.eth,来源:X
Exploring the Future of AI Agents in Crypto,来源:Binance Research