端侧AI领袖之声:移远通信--移联万物,智赋无界
来源 | 物联网智库2025-04-23 11:51:27
2025年,产业链进展频频,标志着端侧AI进入规模化商用元年。产业生态呈现出双向奔赴的积极态势:终端厂商加速推进“All in AI”战略转型,通过硬件架构重构和系统级优化打造AI原生设备;上游芯片厂

2025年,产业链进展频频,标志着端侧AI进入规模化商用元年。产业生态呈现出双向奔赴的积极态势:终端厂商加速推进“All in AI”战略转型,通过硬件架构重构和系统级优化打造AI原生设备;上游芯片厂商推出专用NPU架构;模组企业则开发贴合应用场景的端侧AI计算解决方案。至此,产业链上下游形成了“芯片-算法-模组-终端-应用”的协同创新闭环。本期《端侧AI领袖之声:中国端侧AI企业深度访谈专栏》,物联网智库邀请到移远通信产品总监——王韬,就端侧AI产业发展以及移远通信目前的端侧AI布局进行了深入交流。

端侧部署价值独特,全栈AI能力推动端侧AI全面落地

终端智能化革命,本质上是将AI从技术特性升维为设备本体属性,其商业价值的创造逻辑正在从“功能满足”转向“智能共生”。在端侧AI技术推进下,智能终端产业正在迎来新的战略机遇期。对于端侧AI的独特价值,移远通信产品总监王韬表示,“端侧AI部署会将大量的数据存储和处理都在本地设备内直接完成,显著缩短响应时间。其次,可以极大降低个人隐私、工业生产等敏感数据泄露风险。”同时,移远通信的端侧AI方案支持在离线环境中运行,大模型在本地即可完成推理,通过模型工程化调配,整个推理成本也有所降低。王韬认为,在端侧部署 AI,难点在于如何做到平衡。端侧设备硬件资源有限,要在有限的资源里,充分实现端侧AI的高性能、低延迟以及高能效,并非易事。“本质上,这是个复杂的系统平衡问题,移远通信在不断优化,力求让整个解决方案达到最佳平衡点。”具体来说,首先是模组算力与功耗的平衡。移远通信会根据不同的应用场景,对算法压缩和硬件加速做差异化调整。在模型效率和精度上,针对端侧模型AI智能的损失,移远通信运用向量数据库、RAG、模型微调等一系列技术加以补偿。对于传统算法模型的解决方案,移远通信推出了AIFex算法训练平台来进行高效训练,以提升端侧AI设备的智能化程度。从端侧AI本身的独特价值,到模组、模型、应用的适配调整,体现了移远通信在端侧AI模型的开发和应用能力。移远通信产品总监王韬强调,想要充分发挥端侧AI大模型的应用潜力,离不开周边一系列的AI算法,比如音频算法、图像算法等等。“端侧大模型周边的算法是我们的传统强项,移远通信不仅提供端侧AI模组,更能提供这种完整的端侧AI算法和整体解决方案。”

在采访中我们还了解到,在模型落地应用方面,移远通信已经积累了很多年,尤其是端侧部署的AI算法模型。移远通信在研发智能模组时,就开始根据客户不同的算法需求,积累深度学习、神经网络等方面的技术。随着AI技术爆发,特别是今年端侧模型大量涌现,移远通信凭借积累已久的全栈AI研发能力,快速推出端侧AI模型整体解决方案。除此之外,不管是传统的Transformer模型,还是现在以DeepSeek为代表的MoE架构模型,移远通信均表示会持续关注,并针对不同架构的AI模型,不断更新AI模型研发能力,确保在端侧AI时代保持技术领先。从我们的观察来看,不论是行业还是消费者,今年对AI的期待都很高。那么如何凭借AI技术的积累,讲好智能时代的新故事,并利用端侧AI落地发展周期将用户生态培养起来,已经成为今年供应商的核心命题。

技术与应用相结合,移远AI算法和解决方案助力终端设备快速智能化升级

对于终端厂商而言,如何快速将终端产品、应用场景与本地智能结合起来,并不是一件容易的事。与终端设备关系紧密并熟悉应用场景的模组厂商,是将这些串联起来的最好的桥梁。模组厂商将端侧算力模组与模型技术融合,根据应用场景提供适配解决方案,将大幅缩短端侧智能相关产品的落地周期。移远通信的智能模组产品矩阵十分丰富,可满足低、中、高不同算力需求。对于在计算能效上要求严苛的应用,移远通信能提供12 TOPS算力的SG560D,满足需要兼顾算力、成本和功耗的端侧应用;主推的搭载高通QCS8550平台的高性能AI算力模组SG885G,成功实现了DeepSeek-R1蒸馏模型的稳定运行,生成Tokens的速度超过每秒40个,且随着性能的不断优化,速度还在进一步提升。移远通信产品总监王韬透露,100 TOPS左右算力的产品也即将面世。“终端侧场景丰富多样,对算力和通信功能的需求各不相同,在移远,我相信客户总能找到适合的产品。”算力硬件构筑起基础底座,在模型层面,移远通信端侧AI大模型解决方案以“LLM(大语言模型)+ RAG(检索增强生成)+ Agent(智能体)”技术三角为核心,通过对AI模型的深度优化与增强,重新定义了 AI 端侧设备的智能化逻辑。特别是随着DeepSeek AI模型带来的开源潮热度持续上升,今年AI模型在多模态领域也“卷”了起来,具备多模态交互推理能力的多模态模型成为焦点。

王韬在采访中分享了移远通信在多模态模型上的布局,他表示,“在高端算力模组方面,移远通信在端侧离线多模态大模型的部署和运行已经取得成果。针对低算力模组,可采用端云融合的方式来满足多模态交互的应用场景。”随着算力模组性能进一步提升,更多智能功能得以在本地实现,这也意味着更多终端设备能向更高阶的智能化跃升。小到PC、玩具、可穿戴设备,大到家电、智能汽车、具身智能机器人,移远通信凭借全栈AI研发实力,针对不同终端应用持续优化其AI方案,解决了多层次的软硬件AI场景需求,助力终端设备智能化功能更早落地。随着模组厂商持续优化硬件平台、端侧算法模型,全力促进场景落地,端侧智能应用有望在今年迎来爆发式增长,成为最值得期待的行业看点。

展望2025端侧AI

展望今年的端侧AI发展,移远通信产品总监王韬表示,“端侧AI市场虽然分散,但积少成多,我们认为这是一个巨大的增量市场。端侧AI即将迎来爆发,端侧设备智能提升必将实现。”