科大讯飞董事长刘庆峰:AI赋能数智创新
来源 | 人民邮电报2022-12-21 17:10:25
在日前举办的2022中国移动全球合作伙伴大会主论坛上,科大讯飞董事长刘庆峰进行了线上主题演讲...

在日前举办的2022中国移动全球合作伙伴大会主论坛上,科大讯飞董事长刘庆峰进行了线上主题演讲。他表示,过去一年,科大讯飞在多模感知、多维表达、深度理解和运动智能四个方面实现了关键技术突破,推动AI能力不断升级,持续用系统性创新解决重大社会命题,加速赋能数字经济发展。

人工智能是赋能数字经济发展的核心引擎

在当前全球军事、政治、经济的高度不确定下,全球经济复苏的关键动力到底在哪里?刘庆峰提到,数字经济是全球经济复苏的关键动力,人工智能是数字经济下一步发展的核心引擎。2021年,全球47个国家和地区数字经济增长达15.6%。科大讯飞开放平台实名认证的开发者团队数量达到370多万,一年新增32%,增长了近100万家,人工智能的调用总量增长了36%;科大讯飞语音输入法去年一年调用量增长45%,其中“95后”年轻人的使用量是其他人群的两倍以上……

源头技术的持续创新是引领人工智能发展的必选之路

人工智能解决重大社会命题,需要坚持源头核心技术的持续创新,在单点技术持续突破的基础上,加强多项技术深度融合,比如,科大讯飞在多模感知、多维表达、深度理解和运动智能四个方面关键技术的突破和系统性创新。

多模感知不只有语音的感知,还有视觉、眼神、面部表情、肢体语言、环境的综合感知,包括味觉、触觉等。科大讯飞推出可以将唇形和语音技术相融合的多模态语音交互系统,让语音识别在高噪声场景下得到了运用。比如,地铁站买票的场景,除了用户自己的声音外,周围人说的话也会被机器捕捉到。那么,想要从嘈杂背景环境中分离干净的人声,除了必需的语音识别技术外,还可以结合唇形等图像识别技术。同时,科大讯飞还推出了凌空手写、眼神打字等功能,这些都可以实现在虚拟世界和元宇宙中的自然沟通与交流。

多维表达可以把文字内容配上图片、虚拟形象和语音,用更立体的方式对外表达。比如,AI读朱自清的散文时,就可以生成朱自清的形象;读林徽因的散文时,就可以生成林徽因的形象。有了这样强大的多维表达功能,根据文章的进度,随时随地都可以配上AI生成的画面,既生动又有趣。

过去一年,科大讯飞把AI的深度理解能力和认知能力提升到全新的高度。在权威的知识推理比赛OpenBookQA上,科大讯飞的AI在单模型上已经首次超过人类水平,这标志着AI认知智能的重大突破,从而使机器可以在越来越多的领域帮助人们解决更专业和复杂的问题。

运动智能是把多模感知、多维表达和深度理解结合在具体的机器人、机器狗、玩具等形象上面,从而在现实世界为人类提供更大的帮助。近期发布的讯飞运动机器人,其强大的运动能力让人眼前一亮。

刘庆峰表示,以上这些都是科大讯飞承建的语音及语言信息处理国家工程研究中心和认知智能国家重点实验室的最新成果。无论是从关键技术0到1的突破还是系统性创新,科大讯飞都处于全球领先水平,在2021年美国国家标准与技术研究院组织的15个语种的国际比赛中,科大讯飞包揽了22项第一名。

让懂知识、善学习、能进化的机器人走进每个家庭

要满足未来社会事业、人类发展的刚性需求,需要懂知识、善学习、能进化的机器人。科大讯飞在今年年初提出了“讯飞超脑2030”计划,希望让懂知识、善学习、能进化的机器人,无论是虚拟形象的机器人还是实体机器人,未来能够走进每一个家庭。在人口老龄化的大背景下,“讯飞超脑2030”计划具有非常重要的产业意义和社会意义。刘庆峰还提到,未来老人或许可以穿上外骨骼机器人,跑步不会摔跤,搬东西不会扭伤胳膊,可以像年轻人一样登山,非常“拉风”。

助力中国移动数智化转型及高质量发展

科大讯飞推动人工智能产业落地,在教育、医疗等领域服务了海量用户。在医疗领域,科大讯飞“智医助理”可为一线医生提供AI辅助诊断建议。2017年,“智医助理”以456分的成绩在全球首次通过了国家临床执业医师笔试测试,超过了96.3%的人类考生,首次让机器具备了全科医生的潜质。截至目前,科大讯飞“智医助理”已在全国共覆盖380个区域,AI辅诊5.1亿次,修正诊断数超60万次,累计识别不合理处方数达3824万,AI辅助诊断准确率提升至97%,覆盖疾病数量超1400种,有效降低了错诊漏诊和用药错误风险。刘庆峰表示,目前科大讯飞正在跟中国移动合作,将这些应用与家庭的电视大屏交互起来,使老人在家里用遥控器就可以享受AI的疾病自查、健康测评等服务。

在今年的北京冬奥会上,科大讯飞成功打造了历史上首个信息沟通无障碍的奥运会,所有运动员、工作人员和志愿者都可以通过讯飞翻译机进行无障碍沟通,用“讯飞听见”进行会议转写和翻译。在冬奥会成功运用的基础上,科大讯飞与中国移动开展了5G无障碍通信的战略合作,在软交换和底层硬件上增加了科大讯飞的翻译能力,让普通的5G手机用户不用下载任何软件,就可以实现实时翻译和转写。刘庆峰提到,在未来5年内,人类语言的“巴别塔”有望真正建成,无论是我们与全球沟通,还是各种方言、少数民族语言之间的互译,以及适老化的大字显示、在商务通话中的快速记录和分享、沉浸式的虚拟化互动等,都将在不久的将来被广泛应用。

此外,科大讯飞进一步利用人工智能和RPA技术,打造人工智能的数字员工,在合同审核、财务助手、自动客服、会议记录、AI招聘等越来越多的场景得到了广泛应用,用AI帮助更多人从繁杂的重复劳动中解放出来,从而大幅提升工作效率,减少工作疏漏。

在虚拟经济尤其是大家日益关注的元宇宙方面,技术不仅可以带来沉浸式的虚拟体验,还可以让虚拟人给真实世界带来切实的帮助。科大讯飞与产业合作伙伴共建虚拟人生态平台,目前已经建设了覆盖虚拟助理、虚拟服务机器人、虚拟电商主播、虚拟导游、虚拟IP等数百个形象和声音,为媒体、金融、文旅、政务、电商等行业场景的客户提供虚拟人解决方案。刘庆峰提到,前不久科大讯飞发布的虚拟音乐偶像Luya,它的一首歌曲《铠甲》在短短几天之内转发量就达上千万次。未来,虚拟人不仅好玩、有用,还可以很有温度。

十年并肩携手,共谱数字发展新华章

科大讯飞与中国移动的携手源远流长。2012年中国移动战略投资科大讯飞,成为科大讯飞单一最大股东。十年来,科大讯飞资本价值得到了持续增长,是过去10年A股上市公司中唯一连续10年营收增长率均超25%的上市公司。在投资价值持续提升的同时,双方战略协同不断推进,助力中国移动CHBN四大市场全面发展及数智化转型升级,取得了诸如“智慧家庭语音遥控器累计发展7500万家庭用户”“智能客服平台月均服务2亿次”“统一 AI云平台累计调用超176亿次”等一系列丰硕的协同创新成果。

人工智能正在深刻地改变人类的生产和生活方式,虚拟经济和实体经济也将深度融合发展。刘庆峰表示,在人工智能和数字经济发展的浪潮下,科大讯飞将进一步发挥人工智能优势,依托中国移动的5G和基础通信能力,回归价值创造的根本,共同谱写数字经济发展的全新华章。