DeepSeek推动SLM与AIoT加速融合,AI代理经济驱动硬件智能化
作者 | 创始人2025-02-25

作者:彭昭(智次方创始人、云和资本联合创始合伙人)

这是我的第361篇专栏文章。

DeepSeek的热度持续发酵,目前已有超过30家企业推出了“大模型一体机”,其中以“DeepSeek”命名的约有20家。

这一现象实际上反映了中国人工智能大模型从量变到质变的演进过程。

根据信通院发布的《全球数字经济白皮书》,中国拥有全球超1/3的人工智能大型语言模型(LLM)。数据显示,全球LLM数量已达1328个,中国占比36%,仅次于美国,位居第二。

可以预见,在与LLM大模型接壤的小型语言模型SLM和AI智能代理领域,中国企业的崛起也指日可待。

作为制造业强国,中国为AI硬件的蓬勃发展提供了得天独厚的土壤。

未来,我们将看到越来越多能够智能响应主人语音指令的AI家居硬件,以及与环境无缝互动的AR智能眼镜等创新产品。这些产品的问世,将进一步推动AI技术在日常生活中的普及和应用。

值得注意的是,进入2025年,AI智能代理的时代已经来临。在不久的将来,AI代理将能够胜任许多任务,大大提高生产效率和生活品质。新兴的技术框架将使我们能够更快、更高效地构建AI代理。

目前各大科技巨头也已经展开了一场争夺AI代理的关键竞赛。

这将形成一种新的经济形态:AI代理经济的崛起,我们也将由此从AI模型进入AI代理经济的发展阶段。

在AIoT领域,尤其是SLM的发展趋势以及AI代理经济的未来形态值得我们密切关注。

一方面,SLM与LLM的融合将催生出更多适用于特定场景的AI解决方案;另一方面,AI代理经济的崛起将重塑人机交互的方式,为各行各业带来创新变革。

因此今天这篇文章,我们一起来探索更适合AIoT领域的SLM发展趋势以及AI代理经济的未来形态。

更适合AIoT的小模型:兼顾性能与成本的最优解

根据Gartner的预测,SLM(也被称为轻量级LLM)的兴起已经成为确定的趋势。小型语言模型SLM弥合了高性能人工智能系统与安全、经济高效的解决方案需求之间的差距。

这些SLM模型不仅经济高效,而且适应性强,能够以最少的资源需求提供高质量的结果,因此成为企业的理想选择。

看到了小模型的独特机会,知名企业已经纷纷布局。随着技术的发展,小模型不仅发挥了低成本上的优势,在性能上也不逊色于大模型。

如下图所示,通过将Llama 8B与大模型GPT-4o进行比较,我们发现虽然GPT在质量方面比小型模型高出20%以上,但在增强了小型Llama模型之后,它可以与LLM相媲美,并且在某些任务中表现优于LLM,同时保持较低的使用成本。差异如此之大,令人难以忽视。

Llama 3.1-8B与GPT-4o的比较进一步证明了SLM在成本和性能方面的优势,见下图。首先,与LLM相比,SLM的运行成本只是其一小部分。在零样本设置中,Llama 3.1-8B的成本明显低于GPT-4o。其次,只需进行少量额外训练,SLM就能在特定任务(如客户支持或法律研究)中达到接近甚至超过LLM的质量水平。最后,Llama 3.1-8B在经过精细调整的设置下实现了超过96%的任务质量,证明了其在重点用例中实现高精度输出的能力。

从功能定位上看,LLM更像是“云端AI操作系统”,吸收中间层,形成API生态;而SLM更像是“本地AI计算引擎”,嵌入终端设备,增强隐私与实时性。

LLM与SLM的功能定位与协同发展

未来,LLM与SLM将形成端云协同,共同推动AI的发展。

随着技术的不断发展,LLM和SLM的未来趋势也呈现出不同的特点,我们不妨进行一个对比。如上图所示,我们先看左侧的LLM部分:

首先,核心LLM将成为通用AI基础设施。未来可能形成极少数头部LLM竞争的格局,类似于Android与iOS的双寡头或多寡头情形,而不是单一标准。OpenAI、Google、Anthropic、Meta、DeepSeek等都可能成为基础模型提供商,并各自形成生态。这种格局可能会演化成开源vs商业闭源的两大阵营。

其次,云服务商层将实现API化,但存在更多差异化竞争。大模型即服务(LLM-as-a-Service)将成为标配,但不同云服务商可能会围绕行业垂类优化,形成差异化竞争。例如,金融、医疗、法律、教育等垂直行业的LLM可能会有更定制化的API,而不是直接使用通用LLM。

第三,中间层将向更专业的AI代理形态演进。虽然一部分优化和功能会被云服务和底层模型吸收,但插件化、代理化、模型微调等工具仍然有生存空间。例如,企业级RAG解决方案、特定行业的定制化LLM以及AI代理生态等都将得到发展。

第四,应用层将聚焦高价值场景。AI作为增强人类能力的Copilot存在,我们与AI的交互方式可能发生改变,大部分企业都需要将AI作为客户类型之一进行考虑。例如,AI可能会在法律、医疗、教育、设计、软件开发等领域提升生产力,而不是完全取代人类;AI可能会增强个性化体验,如AI生成的个性化教育方案、健康管理等。软件与硬件的编写和制造方式都将发生改变,例如前特斯拉人工智能高级总监Andrej Karpathy提出软件2.0就是从人工编写代码过渡到基于大量数据观察自动生成代码。

第五,零边际成本社会可能会成真。各类AI的边际成本确实在降低,但数据隐私、算力成本、监管框架可能会成为影响因素。例如,欧盟、美国、中国等国家可能会对AI训练数据、生成内容合规性进行监管,影响AI任务的自由度;个人数据安全、企业专有数据的AI处理,可能会影响AI服务的边际成本是否真的趋近于零。

与LLM主要依赖于云端大规模算力不同,SLM更适用于边缘计算、低功耗设备、端侧智能,因此其趋势可能与LLM不同。

首先,SLM将广泛植入边缘硬件,如智能家居硬件、车载设备、工业设备等。受限于设备算力、尺寸以及功耗的制约,SLM将会被进一步针对设备“量身定制”。例如,智能门锁的SLM可自主识别用户,提供个性化安全管理;工业生产线的SLM可基于传感器数据进行故障预测和优化生产。

其次,本地AI计算将减少对云的依赖,增强隐私保护。本地运行SLM可以减少数据上传云端的风险,例如端侧AI计算可以在智能硬件上直接完成NLP任务,而无需联网。边缘AI可以本地识别语音、图像、手势,减少依赖云端服务器,提高响应速度。此外,云端算力昂贵,本地SLM可以降低AI计算的长期成本。

第三,SLM可能形成“端云协同”模式。本地SLM处理常见任务,如语音助手、图像识别、文档摘要、翻译等;云端LLM处理高复杂度任务,如AI代码生成、AI科研(如AI生成药物)等。

第四,SLM的商业模式可能是“设备即服务”或“AI订阅制”。未来的AI可能不再是单独的软件,而是硬件的一部分。订阅模式可能包括基础AI功能免费、高级AI订阅收费,以及硬件+AI订阅捆绑销售等。

最后,所有硬件都可以使用SLM重做一遍。在SLM的视角下,硬件中的“原子”和软件中的“比特”具有相似性,硬件可以按照软件的逻辑重新制造,硬件制造的边际成本也将快速下降。

小模型AI代理的两种生态:横向通用与纵向专业

在探索了LLM与SLM的发展趋势后,我们再来分析基于这两类人工智能模型的AI代理经济。

与LLM主要依赖云端计算不同,SLM更强调本地计算、低功耗和隐私保护,因此基于SLM的AI代理在组织方式和商业模式上都会有所不同。

SLM将更多嵌入智能家居、智能汽车、工业物联网设备等边缘硬件,形成一个广泛分布的AI代理网络。

由此推断,小模型AI代理可能将分为两种模式:横向AI代理生态和纵向AI代理生态。

  • 横向AI代理生态适用于大规模通用任务,如语音助手、智能翻译、日程管理、家庭自动化等。这种模式具有低成本、高普及度的特点。这类AI代理的目标是提升用户体验、降低交互门槛,并通过订阅或硬件捆绑的方式盈利。

  • 纵向AI代理生态则适用于特定行业的专业AI任务,如智能汽车的AI驾驶助理、工业IoT设备的AI预测维护、医疗设备的AI诊断支持等。这种模式具有高附加值、深度优化的特点。这类AI代理可能直接集成在终端设备中,由企业购买或订阅。

相比LLM主要依赖云端API访问,SLM代理经济的核心驱动力在于以下几点:

  1. 计算本地化,减少对云的依赖。SLM运行在本地设备上,减少云端计算成本和隐私风险,适用于低时延任务,如智能家居控制、车载AI交互、边缘安全监控等。

  2. AI代理的“隐形智能化”。未来AI代理将默认嵌入设备,而不是单独的SaaS订阅模式。硬件厂商会捆绑AI代理,例如智能冰箱可以自动管理食物存储、智能汽车可以预测驾驶行为。

  3. 端云协同,智能分工。SLM处理本地任务,减少带宽和算力消耗,而云端LLM负责更复杂的推理任务。例如,智能眼镜上的AI助手可以本地完成简单任务,但更复杂的任务仍然需要云端LLM支持。

SLM代理经济的盈利模式也与LLM不同,更倾向于硬件+AI功能捆绑,或者采用订阅增值模式。

硬件捆绑销售可能将是一种主要模式,AI代理直接集成到智能设备中,成为“默认功能”,用户无需额外订阅。这种模式适用于智能眼镜(端侧AI语音助手)、智能家居(AI语音控制+设备管理)、智能汽车(AI驾驶辅助)、工业IoT设备(AI预测性维护)等场景。

另一种模式是订阅增值,部分高端AI代理功能可能会采用订阅模式,类似于特斯拉FSD的软件订阅。基础AI代理免费,高级AI代理订阅收费。企业级AI代理(如AI质检、AI医疗分析)可能采用SaaS订阅模式。

未来可能会出现端侧AI代理市场,允许用户下载和激活不同的SLM代理,类似于APP应用市场,但专门用于AI代理。用户可以下载AI运动教练、AI营养师、AI车载助理等不同的智能体。“AI代理即服务”的商业模式可能成为主流。

总之,SLM在边缘计算和端侧智能硬件中的AI代理经济,将以“隐形AI智能+端云协同”为核心,形成“硬件捆绑+订阅增值+代理市场”的商业模式。

写在最后

DeepSeek的持续热度反映了中国在AI领域的快速崛起,这种量变到质变的飞跃离不开中国的独特土壤,未来的进一步催化也离不开LLM与SLM的协同发展。

LLM作为“云端AI操作系统”,SLM则扮演着“本地AI计算引擎”的角色,两者在功能定位和商业模式上各有侧重。

DeepSeek现象的持续发酵,正是这一历史性转折的生动注脚。我们可能很快将会迎来一个“AI代理无处不在”的时代,AI代理将深度嵌入我们的日常生活中,成为真正的数字助手。

参考资料:

The Next 10 Years Will Be About the AI Agent Economy,来源:NFXSmall Language Models for enterprise AI: Challenges, benefits, and deployment strategies,来源:deviniti.com


热门文章
慕尼黑上海电子展将于2025年4月15-17日在上海新国际博览中心W3-W5、N1-N5举办。展会设立半导体、传感器、电源、测试测量、半导体智造、分销商、无源器件、显示、连接器、开关、线束线缆、印刷电
2025-02-25
X