在“鸡兔同笼”和“洛阳纸贵”上,百度文心一言赢了?但是股价……
来源 | 物联网智库2023-03-16 17:00:56
百度“文心一言”正式发布,并展示了其在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力...

昨天凌晨,OpenAI突然发布的GPT-4让所有人感受到了它强大的能力:不仅支持多模态,逻辑推理能力也大大提升,部分标准化考试的成绩甚至超过了90%的人类......

在这种情况下,估计昨天百度的员工“特别忙”,因为从2月份开始,百度就开始对“文心一言”进行大规模预热,今天百度发布的“文心一言”将不可避免的会被拿来和GPT-4进行对比,网上更是充斥着“压力给到了百度这边”等类似话题,大家都迫切想要看到“中国版ChatGPT”的表现到底如何。

但,该来的总是会来的。

今天下午2点,百度在北京总部举行了新闻发布会,主题围绕“文心一言”。李彦宏表示,作为国内大型企业中首家发布“类ChatGPT”产品的企业,百度之所以选择最先发布,是因为市场有需求,百度包括搜索、智能云以及小度音响等在内的产品,以及众多的合作伙伴,都等待着用这项技术,因此百度需要尽早的发布这项技术。

文心一言的五大能力

具体来说,文心一言具有文学创作、商业文案创作、多模态生成、数理逻辑推算、中文理解等能力这五大特色功能。

文学创作

在现场,李彦宏通过通过6轮有关三体的对话演示,体现出了文心一言所具有的总结能力、推理能力等,很多事实性内容对于大模型来说很容易出错,而百度的文心一言通过采用了5500亿知识图谱的事实的训练数据,来保证事实性问题回答准确。

文学创作

商业文案创作

在商业文案创作方面,文心一言表现出的能力符合预期,还为生成的5个公司名称进行了一一解释。

商业文案创作

数理逻辑推算

在“鸡兔同笼”这一中国古代典型数学题的演示过程中,文心一言展现出了自身具备的数理推理能力,不仅可以给出答案,同时也给出了解题步骤,甚至在题目有问题的时候还对用户进行了提示。

数理逻辑推算

有意思的是,我们也将相同的问题向ChatGPT进行了提问,第一个问题虽然看似推理的很有逻辑,但ChatGPT并没有给出正确的答案,第二个问题则得出了和文心一言相同的结果。

数理逻辑推算
数理逻辑推算

中文理解

据李彦宏表示,文心一言使用了大量中文数据集来进行训练,在现场展示的有关“洛阳纸贵”的一系列问题中,藏头诗的能力让人印象深刻。此外,在谈到文心一言能不能处理英文的问题时,李彦宏表示可以处理,但他也承认文心一言对英文的理解和处理能力现在还没有中文这么好,部分原因是因为在训练数据样本还不够大。

中文理解

同样的,为了更直观的进行对比,我们还是用ChatGPT来生成了藏头诗,两次回复的结果都表明ChatGPT似乎没有理解藏头诗的含义,在这一环节,文心一言可以说是远超ChatGPT的表现。

中文理解

多模态生成

在多模态生成方面,文生图能力大家已经司空见惯,但令人没有想到的是,文心一言具备了用语音进行回复的功能,甚至还可以将回复的文字内容直接生成视频。据李彦宏表示,目前每天已有几万个通过此功能生成的视频在百家号里分发。不过,这项功能暂时还没有对外开放。

多模态生成
多模态生成

据悉,文心一言是一种生成式大模型,这是一种技术栈的变化,对于算力的要求很高,可以说是一种“暴力美学”,通过芯片层、框架层、模型层、应用层这四层架构之间的相互协同,优化后可以使得成本降低,效率提高。在未来,很多人的工作性质也会因为更多大模型的出现而发生不可逆转的改变。同时,李彦宏表示,大模型也给产业带来了新型云计算、行业模型精调、应用开发这三大新的机会。

多模态生成

文心一言的底层技术

据李彦宏介绍,文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。

从底层来看,文心一言使用了六大技术模块,包括知识增强、检索增强、对话增强、有监督精调、人类反馈的强化学习、提示。其中,百度有特色的在于知识增强、检索增强、对话增强:在知识增强方面,知识图谱为知识内化和知识外用提供了支持;在检索增强方面,百度搜索引擎每天有数以亿级的使用量,通过使用基于语义理解和匹配的新一代检索架构,可以和生成模型进行联合优化,使得生成的效果更好;在对话增强方面,记忆机制、上下文理解和对话规划也都很重要。

同时,百度研发多年的飞桨也从开发训练和推理部署两个方面来支撑文心一言效果更好、效率更高、性能更强。

文心一言的底层技术

从今日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。3月16日起,正式开放预约,搜索“百度智能云”进入官网,可申请加入文心一言云服务测试。

文心一言的发展历程

说起文心一言,最早应该可以追溯到2010年百度成立的“自然语言处理部”,到了2019年时,百度发布的通用大模型“文心大模型ERNIE”则是现在文心一言的底座,经过了多年的发展,“文心”家族也早已经发展壮大起来。

文心能力全景图

文心能力全景图

不过,相比于2010-2019年的超长时间跨度,在ChatGPT发布后的巨大影响力之下,留给文心一言的时间却没有那么多,从密集发布的造势新闻中,也可以看出百度所面临的巨大压力:

2月7日,百度官宣“文心一言”项目时,英文名是“ERNIE Bot”,三月份完成内测,面向公众开放。百度CTO王海峰任项目总指挥,其他带队高管还包括:百度集团副总裁吴甜、百度技术委员会主席吴华等人。

2月13日,百度消息,文心一言3月和大家正式见面。

2月17日,在2023 AI+工业互联网高峰论坛上,百度智能云宣布“文心一言”将通过百度智能云对外提供服务,率先在内容和信息相关的行业和场景落地。百度集团执行副总裁、百度智能云事业群总裁沈抖表示,“文心一言”是基于百度智能云技术打造出来的大模型,它将根本性地改变云市场的游戏规则,云服务将从数字时代跃迁到智能时代。

2月22日,李彦宏在发给百度全员的财报信中重点介绍了百度将在三月份推出的生成式AI产品文心一言,宣布计划将多项主流业务与文心一言整合,将帮助百度增加用户粘性。

2月28日,百度官方宣布:百度计划于3月16日14时在北京总部召开新闻发布会,主题围绕文心一言,甚至发布会的邀请函也出自文心一言之手。

从2月份开始预热起,至今已有650家伙伴加入了文心一言生态,李彦宏表示,这是任何一个企业都不能错过的机会,会释放出指数级的商业需求,AI市场也将迎来爆发性的需求增长。

图片

在国内一众宣称正在开发“类ChatGPT”的科技公司中,或许只有阿里、腾讯、百度等大厂对大语言模型进行了大规模且长期的投入,百度则是三家中对于人工智能倾注心血和时间最多的一家。目前,百度在人工智能领域已经深耕十余年,拥有产业级知识增强文心大模型ERNIE ,具备跨模态、跨语言的深度语义理解与生成能力,在搜索问答、云计算、内容创作生成、智能办公等众多领域都有应用。同时,百度搜索引擎更是在我国占据了绝对优势,海量的中文语料更是它区别于其他企业的“底气”。

可以说,从技术实力和应用场景上来看,百度是目前最有希望在大模型上追赶OpenAI的中国公司。不过,从发布会过程中百度股价的实时变化来看,市场已经表达出了它的态度。

百度股价

写在最后

这一次,百度的确有些运气不好,昨天突然发布的GPT-4,让大部分人对今天发布的文心一言已经有了自己的判断,但对于百度来说,其实未来的机会依然很大。

首先,在中文领域,OpenAI等国外企业所掌握的数据明显少于百度,再加上数据安全和法律法规等限制因素,类似战胜谷歌的战役可能会再次上演;其次,大模型虽然表现出了惊人的能力,但商业模式的探索才仅仅是个开始,未来还有极大的不确定性,此次的发布会更是抢先占据了国内用户的心智,有利于文心一言生态的快速建立。

在文心一言发布会的最后,大屏幕上显示出“AI的终极理想是为人类带来更多自由和可能”,对于真正的终点来说,现在才只是走过了起跑线而已。