7 月 21 日,在 2022 百度世界大会上,百度发布了多款百度最新 AI 技术成果,包括没有方向盘的自动驾驶汽车 Apollo RT6,希加加虚拟数字人,全球首个航天领域的大模型...
“人均一个数字人”的时代已来
虚拟数字人可以说是这次百度世界大会的“主角”了。
“希加加”、度晓晓站上“C 位”
百度 AI 数字人家族的新成员“希加加”是本次大会的 AI 策划官、副主持人和开场嘉宾,与撒贝宁一起同台主持。她连同另一位数字人度晓晓出现在整场大会的多个环节中。“希加加”还具备作画、写诗、作曲、说多国语言、实时直播等多项“超能力”。
百度集团资深副总裁、百度移动生态事业群组(MEG)总经理何俊杰表示,“人均一个数字人’的时代已经到来。”
何俊杰展示了百度 AI 数字人“度晓晓”的最新进展。他认为,度晓晓扮演着“AI 大使”的角色,连接起科技到用户的最后一公里。
“度晓晓”是百度搜索能力的重要进化。目前,“度晓晓”已经上线百度 App,用户直接在百度 App 搜索“你好”,即可召唤度晓晓。
据悉,在百度 App 内,度晓晓可以连接所有的智能生活服务:面对用户的个性化提问,度晓晓通过百度“问一问”快速匹配专业答主,提供一对一真人咨询服务,目前“问一问”已覆盖法律、情感、心理、政务等 19 个领域超 4 万名答主。
百度 AI 创造的数字人度晓晓、希加加所具备的理解和生成能力,可以令其自动生成创意作品。会上,龚俊数字人与度晓晓一起表演了 AIGC 单曲《每分 每秒 每天》。度晓晓可以 40 秒完成 40 篇高考作文,几十秒完成一幅美术作品,24 小时不间断情感互动,还能创作脱口秀、直播带货等。
百度创始人、董事长兼首席执行官李彦宏分享了对 AIGC 领域的思考,“未来十年,AIGC 将颠覆现有内容生产模式,可以实现以‘十分之一的成本’,以百倍千倍的生产速度,去生成 AI 原创内容。
李彦宏判断,AIGC 将走过三个发展阶段:第一个阶段是“助手阶段”,AIGC 用来辅助人类进行内容生产;第二个阶段是“协作阶段”,AIGC 以虚实并存的虚拟人形态出现,形成人机共生的局面;第三个阶段是“原创阶段”,AIGC 将独立完成内容创作。
超写实数字人直播平台发布
“全新发布的数字人直播平台,能让 AI 数字人自己做直播,我们全年无休,和用户互动,帮助那些不太擅长做电商的山区农家叔伯、小微企业,改善他们的生活。”会上,AI 数字人希加加这样介绍百度智能云的曦灵数字人直播平台。该平台主要聚焦电商直播、品牌营销、互动娱乐等领域,做到超写实数字人 24 小时纯 AI 直播。
当下,直播行业炙手可热。但直播爆火的背后,真人主播稳定性弱、直播硬件及场景成本高、运营门槛高、闲时流量无法有效利用,也成为其发展的制约因素。
创匠科技 CEO 刘卫表示:“以团队搭建电动牙刷售卖直播间为例,仅硬件成本至少 7 万元,还不包含场地及主播”。百度智能云曦灵通过 AI 驱动的方式,无需真人主播和中控人员,实现内容快速生成,降低运行成本。
判断一位真人主播的受欢迎度,核心原因不过有三:首先,主播的表现力强,外观形象、穿搭风格都令人有记忆点;第二,有个性、很能聊,与观众谈天说地,机智回复;第三,不停更,渗透进大众生活的每一个时间缝隙。要让直播间里的数字人无限接近真人,核心考验的就是数字人的表达力和交互力。
在表达力层面,当前市场上大多产品的数字人精度低,“纸片人”很容易让观众“出戏”。百度智能云在超写实数字人制作方面已研发 3 年,通过数字人自然动作引擎等技术,数字人直播平台生产的 AI 数字人形象亲切、毫发毕现,动作平滑自然,用户能感受到 AI 数字人带着“真情实感”的。
在交互力层面,主播的本质是内容。依靠视觉、NLP、语音交互等底层全栈 AI 技术以及 PLATO 百亿参数对话大模型,百度智能云的数字人直播平台能让数字人像真人一样,与观众捧哏逗趣,机智回复。同时,AI 大模型所支撑的智能创作,也将助力数字人在未来拥有“原创能力”。
想要实现“人均一个”数字人,标准化产品将成为降低运营门槛的关键。
曦灵数字人直播平台,作为一款 saas 化产品,可实现“即插即用”,无需要完整的运营团队、昂贵的直播硬件设备,一个人就可完成全部流程,让数字人直播与写文档、做 PPT 一样简单。同时,数字人直播平台还打通了服务全流程,为合作伙伴提供直播代运营托管、中之人培训等服务。
百度智能云 AI 及应用产品副总经理刘倩表示,“数字人直播平台的推出,将让大家可以低门槛拥有更稳定、超写实、智能化的数字主播,真正解放企业生产力”。
超写实数字人向前发展,对视觉技术也提出了新的挑战。百度视觉技术部、增强现实技术部总监丁二锐表示,百度即将发布“照片引导形象生成技术”,手机摄像头拍摄几张甚至一张照片,即可生产一个拟真、美观且可驱动的超写实数字人人像,相较传统制作流程效率将提升 90%。
据悉,当前,百度智能云曦灵打造的几十位数字人已经落地各行各业,央视网小 C、央视新闻 AI 手语主播,以及希加加等,都曾参与过大型直播。
百度第六代量产无人车 Apollo RT6 发布
会上,百度发布了第六代量产无人车 —— Apollo RT6。
基于自动驾驶技术上的突破,Apollo RT6 不但具备城市复杂道路的无人驾驶能力,而且成本仅为 25 万元。
李彦宏表示:百度把自动驾驶汽车的成本,降低至业界的十分之一,相当于一辆普通新能源汽车的价格。无人驾驶汽车成本的大幅下降,以至于我们可以部署上万辆这样的车在全国各地了。 未来打无人车,要比现在打车便宜一半。
根据规划,Apollo RT6 会于 2023 年率先在萝卜快跑上投入使用,未来可以在全国部署上万辆。它的量产落地,将加速无人车规模化部署。
Apollo RT6 是百度面向未来出行自主研发、正向设计的量产车,整车针对乘客需求和无人驾驶出行场景进行了深度设计。
据介绍,Apollo RT6 外观采用了贯穿一体的空间飞梭车身及银河腰线,突出科技感与安全感;创新性的龙骨天窗,将车顶传感器与天窗结构高度集成融为一体,革新了自动驾驶改装车的造型;为了进一步提升出行便利性,车辆还配置了具有识别和提示功能的灵犀交互灯语、智能电动侧滑门等功能。
智能座舱方面,Apollo RT6 打造了百变智能空间。Apollo RT6 支持有方向盘、无方向盘两种模式,前排可根据不同出行场景配置座椅、售卖机、办公桌、游戏机等,满足乘客办公、娱乐等多元需求。此外,Apollo RT6 后排 1050mm 大空间、独立座椅以及智能交互系统后移设计,实现 A 级车的尺寸、B 级车的空间、C 级车的体验。
Apollo RT6 源自百度自研的「阿波罗星河」架构平台,作为该平台的首款车型,Apollo RT6 实现了 100%车规级和整车全冗余系统,相较于市面上的改装车可靠性高出两到三个数量级,保障乘客出行安全。Apollo RT6 硬件上,具备架构冗余、计算单元冗余、制动系统冗余等七重全冗余系统,任何单一零部件或系统失效,备用的冗余系统都可以瞬时完成补位;软件上,搭载了整车+自动驾驶系统一体的故障诊断及风险降级体系。
百度集团资深副总裁、智能驾驶事业群组总经理李震宇表示,**Apollo RT6 既是一辆车,也是一位好司机,它自带的自动驾驶技术,相当于拥有 20 年驾龄的司机。**Apollo RT6 搭载了百度最新一代无人驾驶系统,具备比上一代车型更强的 L4 级自动驾驶能力,可应对城市各类复杂道路和场景。Apollo RT6 配备的车规级高算力主冗双计算单元,算力可达 1200Tops。全车 38 个传感器深度融合,实现远中近三重检测能力全覆盖,具有更精准感知能力。
过去 9 年来,百度 Apollo 共推出了六代无人车。相较于前五代车型,Apollo RT6 实现了 AI 技术和车辆工程的深度融合,具备高安全、高质量、低成本等优势。
AI 帮助实现“绿灯自由”
百度认为,未来的城市智能交通,不仅要有“聪明的车”,还要有“智慧的路”。
车路协同能有效解决安全、拥堵、碳排放等重要问题。李彦宏认为,“以车路协同为基础的智能交通,可以让通行效率提升 15%-30%,推动 GDP 每年 2.4%-4.8%的绝对增长;随着智能交通的深入实践,四年之内中国的一线城市将不再需要‘限购’‘限行’。智能交通系统,有望降低 90%交通安全事故。”
根据大会上披露的最新数据,百度智能交通方案已经在广州、保定等全国 50 多个城市得到实践和验证,其中,尤以 AI 信控技术最具优势。
这次会上,百度展示的智慧交通成果,更侧重将 AI 渗透进人们的实际生活中。百度通过三个案例展现了智能交通建设如何助城市管理者精准决策,为普通百姓带来“绿灯自由”。
我国有 1700 万卡车司机,在卡车物流运输场景,大雾、暴雨等极端天气导致高速封路往往会延误交货时间,也存在安全问题。在京雄高速上应用的百度智慧高速系统,突破了准全天候通行的技术难题,在雾天等不利天气状况下,司机可以收到智能终端发出的天气、车距、车速、前方碰撞等驾驶信息的提醒,保障司机顺畅、安全通行。同时,凭借融合感知、AI 算法的提升,将设备的部署距离成功扩展至 1 公里,成本降低 30%。
在重庆永川区,AI 可以帮助交警“指挥”交通。在 AI 参与下,信号灯可以自动配时,还有截流控制、动态绿波等应用,不断优化城市交通。一线交警无需站在烈日下指挥交通,可以在智慧城市指挥大厅,宏观把握拥堵情况。数据显示,应用上 AI 后,交通警情处置效率提升了 35%。
在北京这样的超大型城市,交通拥堵频繁发生,尤其上下班路上经常是“一路堵途”。北京亦庄的智能路口建设,解决了这一痛点。百度集团资深副总裁、智能驾驶事业群总经理李震宇将智能路口的效果形容为“灯数车”,他表示,智能路口建设让市民一路绿灯出行不再靠运气。例如,在 332 个智能路口作用下,一趟就能为用户杨晓芳减少 20 分钟通勤时间。
世界首个航天领域大模型发布
百度 CTO 王海峰与中国探月工程副总指挥、国家航天局探月与航天工程中心主任刘继忠发布了世界上第一个航天领域大模型——“航天-百度·文心大模型”。
航天-百度·文心从航天领域的数据和知识中融合学习,可以对航天数据进行智能采集、分析和理解,助力深空智能感知、规划和控制等技术突破。
刘继忠表示,“‘航天-百度·文心大模型’的应用,可以促使科研人员有更多精力投入到创新、创造的工作中。未来,双方将充分发挥各自优势,在深空探测智能技术研发、应用平台开发及项目实施、太空科创科普传播和人才培养等方面开展全面深入合作。”
王海峰还分享了飞桨产业级深度学习开源开放平台助力牧民、农民、电厂工人用上 AI 的实践应用。例如在牧场,基于飞桨开发的母羊分娩预测和预警系统,减少母羊分娩过程的人工看护工作量、降低母羊难产率;农学专家利用飞桨,保障无人驾驶拖拉机等智能农机按照预定的轨迹精准作业;在电厂,基于飞桨打造的电厂设备故障智能预判系统,可智能诊断设备故障,高效检修。
数据显示,目前,飞桨已汇聚 477 万名开发者。在产业级知识增强文心大模型方面,目前文心家族已经发布了 20 多个大模型,包括联合发布的鹏城-百度·文心、国网-百度·文心和浦发-百度·文心等。
值得一提的是,百度在大会现场用 AI 复原了中国十大传世名画之一《富春山居图》的残卷。基于文心大模型“补全”传世名画《富春山居图》残卷,隔三百年的山水合而为一,并题诗一首,,“一峰一状百树迎,天水合璧两岸情”。现在,在百度 APP 搜索“富春山居图”,每个人都可以参与《富春山居图》的“虚拟补全”,创作属于自己的《富春山居图》。
百度智能云的新成绩单:发布开物、九州
百度集团执行副总裁、百度智能云事业群组负责人沈抖分享了百度在企业智能化升级的技术成果。
数字化转型升级已是当下和未来不可忽视的科技趋势。其中,云计算是推动数字化转型的重要基础设施之一。百度智能云侧重将其“云智一体”的能力,先从重点行业的核心场景切入,积累行业经验,再把不同行业的通用需求沉淀到通用 AI 产品中,打造成标准化产品,降低 AI 使用门槛,帮助企业从数字化驱动进阶为智能化牵引。
在帮助传统产业进行智能化改造方面,百度展示了在电力、能源、水力、制造、农业等行业的应用案例。应用实践和数据显示,AI 风机巡检可以代替电力工人冲在一线最危险的地方,让巡检效率最高提升 10 倍;在石家庄城市社区供暖系统的智能化改造项目中,通过智能化管理和调度,整个石家庄城市热网节能 20%....
为助力传统产业智能化改造,降低 AI 使用门槛。沈抖现场发布了全新版本的开物 2.0 工业互联网平台和九州区县大脑。目前,开物 2.0 累积超过 200 个工业解决方案,沉淀了 3.8 万个工业模型,覆盖质量管控、安全生产、节能减排、生产制造等 9 大领域,为工业领域企业上云、用数、赋智提供数字化服务。
除开物 2.0 之外,大会还发布了百度智能云九州区县大脑,用数字技术助推基层城乡治理,孵化地方产业、文化、生态场景的数字化应用。
AI 智能硬件:小度构建“未来的家”
在 AI 智能硬件方面,小度科技 CEO 景鲲现场发布了三款围绕健康的新品——小度添添智能健身镜 M30、小度语音智能闹钟及小度大屏护眼学习机 P20。
据悉,小度添添智能健身镜 M30 可以改善健身枯燥、难坚持等痛点,内置 17 类健身课程,拥有体感游戏、双人游戏、多人在线连麦健身模式等,满足全年龄段人群的健身需求,增强运动的趣味性和互动感。小度添添智能健身镜还具有 “AI 火柴人投影技术”及智能动作指导等功能。除健身功能外,小度添添智能健身镜 M30 还能听歌、K 歌、投屏、刷短视频、播报天气和新闻。
小度语音智能闹钟由小度和中国科学院脑科学与智能技术卓越创新中心等多位睡眠领域专家联合打造,可基于专业的睡眠测试,为用户推荐适合的白噪音、轻音乐,打造专属助眠解决方案。小度语音智能闹钟还能在睡眠期间监测睡眠质量及环境,并生成睡眠质量报告。小度语音智能闹钟还具备红外远程遥控功能,一句话控制家中的新老家电,创造易眠环境。
小度大屏护眼学习机 P20,搭载 15.6 英寸 AI 护眼屏幕,具备防蓝光、防眩光无频闪、AI 屏幕光线自适应调节等 20 重护眼功能。同时基于 AI 摄像头能力,能够实时监测孩子坐姿,当发现错误坐姿时,会主动发出语音提醒给予纠正。此外,涵盖学前教育、整个义务教育阶段在内的全学科内容,同时搭载 AI 精准学系统,帮助学生诊断出学习中的难点和薄弱项等。
景鲲在现场还宣布,未来将在线下增设 100 家全屋智能体验门店,加速小度“未来的家”落地。