导读
5月13日晚,智次方创始人彭昭与AI4C应用研究院管震,围绕“AI加持下的产业数字化变革与创新”主题展开了一场深度对话。本文根据直播访谈内容整理。
随着GPT等大模型的涌现,人工智能已经进入了新的发展阶段。其强大的内容处理与推理等能力,引发了各行各业的关注,大家都在瞄准时机准备随时入局。可以预见的是,大模型已经成为了产业革命的关键驱动力,新一轮产业变革正在悄然而至。
5月13日晚,智次方创始人彭昭与AI4C应用研究院管震,围绕“AI加持下的产业数字化变革与创新”主题展开了一场深度对话。
以下根据直播访谈内容整理:
AI4C:让AI应用实现产业落地
彭昭:今天很高兴邀请到管震管总来和我们探讨“AI加持下的产业数字化变革与创新”。我看您现在新的方向是 AI4C应用研究院,我对这个机构很感兴趣,可不可以帮我们介绍下。
管震:AI4C应用研究院目前还在筹备中,但已经明确了它的目标。可能有些人会好奇其名称含义中的“4C”是什么意思,以及为什么要这样命名?
“AI4C”的含义:第一,“AI4C”是一个词组,意为前瞻预见。人们对于 AI 技术的未来发展非常好奇,因此这个词组暗示了对于未来的探索。
第二,“AI for China”,即人工智能在中国的发展道路上还存在着很多问题,尤其是在产业化过程中,中国虽然处于领先地位,但为什么美国的计算机产业如此强大?大家都对此感到好奇,当然我们也知道其中的一些原因。然而,人工智能应用的本质是更好地服务中国产业。
AI4C应用研究院有一个明确的愿景:希望能够提供一整套的人工智能发展基础架构,摆脱必须依赖 A100 这类芯片的瓶颈,并且让AI应用能够发挥更大的作用。当然我们不能只盯着大模型,真正的人工智能应该更多地关注算法和模型的通用化,以及如何将AI应用落地到产业中,从而实现产业变革。虽然还有一段路要走,但是我们想在研究的范围之内可以缩短这个距离。
“AI4C”中的“C”还有其他几个含义:第一个是computing计算的普适性。第二个是collaborative协同,指的是不同前沿技术和传统产业之间的协同,以及人与人之间,机器与机器之间的协作。
我在演讲中经常提到一个词,“松耦合”。这个松耦合的概念实际上就是一个协作的概念。我们希望在松耦合的情况下,向工业迈出更进一步的步伐,实现第四次工业革命。那么我们如何做到这一点呢?我们可能之前有一些积累,希望它能够应用在产业当中,去帮助更多的传统企业完成数字化转型。我们希望达成的,不仅仅是好的想法和好的技术,还包括人工智能中非常重要的认知能力和创新能力。
大模型开拓新机遇
彭昭:AI 已经经历了几波浪潮,包括机器视觉、语音识别,以及预测性维护等应用。最近大模型这波浪潮出现了,会不会对已经在产业上落地的 AI 应用进程带来一些变化?未来大模型加持下,产业 AI 的应用会发生怎样的新的场景变化呢?
管震:AI 带来的大模型浪潮会对行业带来很大的冲击,这点大家可能都知道。那些从事 AI 行业的人真的是酸甜苦辣,五味杂陈。
有甜的。有些人反应很快,快速做了GPT 的账号交易,赚到第一桶金。
有苦的。我认识的几位朋友,是做 NLP 和知识图谱的。他们都在从事人工智能领域的顶尖研究,每年都会发表非常厉害的论文。但当GPT 这种大模型出现之后,他们就开始感到困惑,就像看到了一艘航空母舰向自己驶来,一点挣扎的意愿都没有。他们发现,自己在研究某些问题时,想了很多办法,但是这些事情在大模型面前根本不用做,因此感到非常困惑。
有酸的。很多人总是各种挑毛病,各种抱怨,说这个模型不行,那个是拼凑的等等。但是,我们希望都能够像国内的百度一样,尽管它们的模型可能不是最好的,但是至少它们开发了一个出来。我们应该往前走,不管它现在是否可行,不管它能否达到高水平。如果前方已经有人立了一个旗帜,告诉你这里没有雷,那我们就应该往前走,行动起来。您刚刚提到了机器视觉的应用。例如,在华南理工大学餐厅,这种应用已经变成标配了。有一个计算机视觉摄像头,将几个小碟子放在餐盘上,然后自动称重计算总价。包括像海底捞,可以自动拍摄并识别餐盘上的菜品。前几年还是需要技术攻坚的事情,那现在已经变成标配了。
对于人工智能的应用来说,第一个最显著的变化是从“飘在天上”到逐渐落地。例如,我的朋友本来是做文字工作、撰写材料的,但是在接触到这个领域后,他发现人工智能可以让他的工作变得更加高效。以前需要两三天才能熟悉资料和市面上的相关信息,但现在只需列出需要讨论的话题并将提纲分配给人工智能,它将自动撰写大纲和论点。这种创新使得人们更加感受到人工智能应用的“落地”。
您刚刚提到大模型将带来什么样的变化?当发现自己的天花板被人捅破时,你会感到茫然不知如何应对。不要急,先把车开起来,不知道往哪里开也没关系。这是第一步。在 AI 圈子里,大家也看到了,ChatGPT 发布后的这几个月,产业变化非常快。好像每天晚上都有新的发布会,发布新的大模型。这是非常可怕的,因为你不知道这些模型训练出来会往哪个方向发展。无论是哪种产业,教育、医疗等等,都会感到来不及了,只好先上车再说。我们必须先使用这些工具。
那么这将会引发哪些变化呢?我感觉这个问题的应用场景还是比较模糊的,模糊不是指不清楚,而是指缺乏方法论。我们在做事的时候通常都有方法论和框架,但是突然间,我们可能会遇到一个天花板的问题,而这时我们之前的方法论和框架已经不再适用了。咱们想象一下,你如果今天踏上了一个新大陆,这块大陆是从来没有人开发过的,那个场景是什么?就是现在的场景,没有边界。
大模型:从弯道超车到空间折叠
彭昭:我现在有一种感觉,大模型已经变成了公司之间的竞争,或者说是那些原本生态位不是很好的公司,它们有了超越的机会。比如最近AIoT头部企业宇视科技发布了行业大模型,明显它已经有了一个弯道超车的机会,让海康、大华等公司感到了一种压力。
管震:我非常同意你的观点,但我不同意你刚才的用词“弯道超车”。
你会发现以 GPT 为代表的大模型的发布,其实给了所有人一个折叠空间去追赶的机会,或者是超车的机会。你之前说的弯道超车或者换道超车,其实有个前提,就是你的车技跟别人差不多,车的性能甚至是比别人好,只不过因为你的排位比较靠后,所以你必须找机会去超车。但不管从哪个角度来看,现在 GPT 给了几乎所有人一个折叠空间去追赶的机会。
我说的折叠空间就是类似这样一个概念,从 a 点到 b 点,我们画一条线。比如说大多数人认为我们要一步一步地读书,对吧?你说换到超车位也好,弯道超车也很困难,你得先去读书,对吧?你说如果上不了高中,就上不了本科,又怎么能上硕士呢?上不了硕士,又怎么读博士呢?可是现在的 GPT 就不一样了,它能够追赶并超越这两个点,甚至能够超出它们,所以它的能力太强了。
你刚才说要超车,但如果我们使用一个大模型作为基础,它就可以超越几乎所有人。即使我们没有这么高的水平,我们也可以在这个大模型上做一些微小的改动,从而达到超越的效果。这会带来巨大的冲击。你会面临一个没有秩序、没有传统的新大陆。这时,就是考验你想象力的时候,你要想清楚自己要做什么。
彭昭:尽管新大陆现在还没有秩序,但我认为它会逐渐建立起秩序。现在的秩序是,谁先在某个产业或垂直领域发布大模型,谁就会有一定的折叠空间,或者是它会拥有一个先发优势,领先于其他人。比如,宇视科技先发布出来了,那么它和第二个发布者之间的时间差自然会吸引一些人,这些人认为在AIoT做大模型是可行的,那么他们可能就会更倾向于与宇视科技合作来探索。这种优势可能是暂时的,最后,实际上这个大模型还需要看数据,或者说产业需要一些更精确、更调优的这样的大模型。因此,在长期来看,我们需要知道这个数据在谁手里,或者说谁有更好的模型调优能力。
管震:在很多场景中,我们可以应用这个概念来追赶那些过去看似无法超越的事物。我们可以尝试去想象,去探索。但是真正走到那一步,当折叠空间之后,就要看你是否能够承受接下来的挑战。就像您所说的那样,如果某个领域的底蕴很深,拥有丰富准确的数据,在基础研究上积累了很多经验,当他开始以更好、更大、更准确的数据和标签,调优更好的算法时,他就能进一步提升。当你们进入同一个赛道时,你的先发优势就会消失。
大模型冲击下的产业:表层与暗层
彭昭:如果我们想在这个时候介入,哪些产业会先受到大模型的影响?
管震:从表面一层来看,这波人工智能浪潮影响的第一梯队产业是AI圈或IT圈。他们发现,多年的研究工作似乎变成了一张废纸,以前他们自己写代码,但现在写代码的全部都变成了GPT。这是第一波直观的冲击。
第二波可能冲击的是教育。可能会对孩子及其相关机构产生冲击,因为现在我们需要找一家机构学习英语等。但是在未来,可能不再是现在这种情况。
第三波受冲击的是“工人”,无论是白领还是蓝领。就像七八年前计算机视觉刚刚兴起时,我们曾经问过:第一波被替代的人是谁?实际上,这些人是产业工人和质检工人。这其实并不合适。我们更希望能够创造出一些新的东西,而不是替代。而且营销策划现在是前后夹击,本来就在开源节流,你写东西、画图又没有GPT快。
当然影响不仅仅是坏的方面,其实也有很多积极的方面,比方说做自媒体营销的,原来一个礼拜能出一篇文章,我现在一天能出 3 篇文章。这都是表面一层受到冲击的产业。
从更深层次的影响来看,看不到的东西是什么?哪些行业会受到影响?
我认为,从 GPT 的能力出发,可以看出哪些行业可能会受到影响。我们来看看 GPT 或其他大型语言模型的本质是什么?它们的本质是改变信息传递和处理模式。前三次工业革命的目的是提高人与人之间传递和处理信息的效率,通过各种工具达到这个目的。无论是文字、货币、数学、物理还是哲学,都在做非常相似的事情,即将物理世界中的规律,抽象为数学模型,例如 E=mc²,以此表达现实世界正在发生的事情。货币的作用是简化以物易物的交换方式。这一切都是在简化信息,以更低的边际成本传递和处理信息。
但是大模型不同。这次大模型的出现,是借助互联网连接人与人,但在这个过程中,如果信息和信息之间的连接是人与人之间的连接通道,那么这就是互联网所做的事情。但我们今天发现,实际上人在其中反而成为信息处理的边际成本最高的一部分。
比如微软推出了一串Copilot for office的AI工具,Copilot 就是这个副驾,在微软会议工具Teams里面也有。你可以想象一下,这些工具都可以做什么?在你开会的时候,它们会帮你记录下要点;比如接下来你需要给谁发一封邮件,然后它就会变成了你在邮件系统日历中的待办事项之一;再然后你收到了这封邮件,需要看一下这个会议里面讲了什么,然后再根据文档写一封邮件,最后将邮件发出去,现在这些也都可以由 Copilot 做。
彭昭 :是的,我特别同意刚才管总你说的, GPT 的出现其实让人们意识到,自己是整个生产过程中可能不太被需要的。这是一个瓶颈,但从两个方面来看,这对人的挑战很大。实际上对公司而言,是有好处的,可以降本增效。
现在很多智能制造企业本身就在评估机器决策和人类决策之间的选择,大家都认为机器决策比人类决策更好。而且正如管总所说,以前的技术应用,比如ETC的出现,真正赚到钱的是哪些公司?赚到钱的不是那些部署ETC或者做基础设施的公司。虽然这些公司的股票市值会短暂地上升,短暂地赚到一些基础设施投入的钱,但长期来看,赚到这波钱的是那些传统的运营公路的公司。因此,从这个角度来看,GPT作为一种基础设施,部署大模型可能会一次性地创造一些营收,但长期来看,还是那些运营大模型和使用大模型的传统公司更有生命力。
管震:太同意你说的观点了,如果大家去注意微软最近发的财报,会发现一个很有意思的事情:它从人工智能带来的营收增长微乎其微,几乎看不见。但是谁可能从中赚到钱呢?你会看到它带动了一大堆有这个概念的企业,突然市值增长了,突然有了新的机会出来。所以说,越是基础架构,未来能赚钱的不一定越多。越是在这个基础上去做一些附加值的事情,就有可能变成垂直创新的领域。
产业创新的两个模式
管震:无论是哪个地方的产业创新,都有两个模式。
第一个模式是通过数字化技术提高效率。
假设公司一共有 5个流程,其中有 3 个流程是生产环节。然后每一个流程、每一个环节都能利用 GPT 或其他数字化技术,来提高自己的效率。因此,我们可以立即算一笔账。
产品研发的同事使用了 GPT,他的效率提升了 10%;在采购和询价时,提升了 10% 的效率;在生产时,原来我的数据散布在不同的地方,无法与之直接对话,也无法直接进行规划,因此我的计划都是胡乱想象的,也很难实现。但是,现在有一个大模型的加持,把原来的系统打通了,可以一起来做统一的规划,这样我们就可以很容易地询问我们的生产和计划应该做什么了。其实在工业场景或其他不同的产业中,你都能算出公司应用了数字化技术或者大模型的效率会提升多少。这是第一个阶段。
第二个阶段是大模型会去自己琢磨,为什么中间要 3 个环节?你不觉得它们很重叠吗?为什么不将它们打在一个圈里呢?这个时候,大模型会发现这三个环节可以混到一起来做。这样一来,我的供应链就可以打通,做到统筹而不用分开来搞了。这时,你会发现你的企业其实只需要 3 个环节就能把原来的这些事情做完了。
第三个阶段,我们需要依赖一些工业大型模型才能完成。虽然这些大型模型目前仍未问世,但是通过它们的思维模式可能会带来第三个变革。目前我只使用了123个节点,原来有5个节点,现在只剩下了3个节点,那么多余的2个节点该怎么处理呢?有两种方法。第一种方法是裁员,开源节流。目前华尔街非常看重这一点,只有裁员,股价才会上涨。第二种方法是什么呢?公司原来提供的能力是工业能力,以前非数字化时代全靠人力,比如客服、接单、销售、营销等都是靠人来完成的。可是现在,当你的整个工业能力被数字化之后,你可以用非常低的边际成本服务于那些原来无法覆盖到的客户,这样就需要更多的人了。
举个例子,拿律师服务来说,你可能平时也用不到或者律师很贵,但是,如果律师的一些能力数字化了,他就可以将一些琐碎的纠纷变成律师服务。只需支付50元,你就可以解决一些小问题。如果你开车不小心剐蹭了一下,感觉有点不服,那就可以通过打官司来解决,而这只是一些较浅的法律服务。这样,律师就可以为许多人提供服务。所以这是你的工业能力的对外输出,我们有很多工业能力可以对外输出,只不过原来没有办法,可是现在碰到了一个机会,能够帮助我们去做这件事情。
第二个大模式是从经验科学到第五范式。
以前,我们无法脱离经验来观察这个世界。但今天,我们第一次可以脱离人类的经验,进行科学的发现和创新。这是非常厉害的。过去,牛顿看到苹果掉在树下,才发现了万有引力。爱因斯坦没有亲眼看到空间扭曲,但他却成功地计算出了空间扭曲。这都是基于经验的科学,即经验的范式。但第四和第五范式不同,我们希望通过数据,让计算机自己去发现。
比如说,如果今天我们碰到一个同学在谈论他自己的经历,说:“这个女生为什么不爱我?”,这是因为你不知道这个女生到底喜欢什么、关心什么。因为你没有足够多的维度去理解她。但是计算机对这个世界的理解,有可能在万物互联的情况下,得到的数据可以趋近于无穷多的情况。或者不用无穷多,它只需要一部分样本。比如,大模型也是一个小样本,对于这个物理世界的还原,对这个自然语言的还原也是一个小样本。在这种小样本的情况下,它可以推理出来绝大部分情况。比如说它可以综合1000 万种维度的数据,然后用几百万个参数组成一个新的模型,然后帮你去理解。比如说,组合完了之后大概有 1 亿多种组合,我挑出了其中三种最有可能能够成功的机会。你要不要看一看?这个时候,这种科学的发现不是原来靠经验去发现的方式。所以,这正是我们创新的第四、第五范式的发生。
彭昭:在大模型时代,我们都急于跟上潮流。因为大模型就像电灯一样,如果没有出现电灯之前,那么对于普通人来说,电能和电力有什么用呢?只有专业人士才知道电机、电动设备或者备用电源的用途,普通大众对于电能没有什么概念。大模型也是如此,以前人工智能对于大众而言,是非常遥远的概念。而大模型的出现使人工智能变得家喻户晓,成为了一个大众化的应用。
管震:让所有人都感受到了科技的力量。
彭昭:是,感谢管总的精彩分享。