文丨郝 鑫
去年一年,大模型行业一面在基础技术上狂飙追赶GPT-4,一面也在沉下来,深入到各行各业的场景应用中。
相关数据显示,截至去年11月份,国内参数在10亿规模以上的大模型数量已有116个,其中金融行业大模型数量最多,约有18个。除了大热的金融行业,交通、政务、制造业、医疗、法律,一场关于千行百业的智能化改造升级正在如火如荼上演之中。
回顾一年的大模型行业落地探索,问题挑战不少,但也看到了新的变革力量。
1月16日,由光锥智能携手Scale Partners势乘资本、中关村会展与服务产业联盟共同举办的“2024 AI 科技峰会”在北京成功举办。本次峰会以“更智能的世界”为主题,汇聚科技企业创始人、产业高管、行业资深投资人等,共话未来科技与产业加速融合的新思路。百度智能云产业发展部总经理段永华受邀参会,并发表了“大模型时代,数智化的行业机遇”的主题演讲,分享其对大模型的基本观点以及百度在政府、金融、交通等领域的落地进展。
核心观点如下:
1、2024年,大模型将进入落地应用阶段,开启从“可用”到“好用”的转化过程。
2、要在时空维度来看待大模型,从三五十年的时间尺度来看,今天的大模型还处在起步期;从空间角度看,我们需要的应该是一个大模型体系。
3、人工智能是通用能力,“智”能和“电”能、“核”能一样,可以渗透至千行百业,切入后端生产、前端管理和服务各个领域。
4、过去12年以来,城市管理领域没有发生真正意义上的飞跃。原因在于数据管理和融合,以及对数据理解和学习没有实现特别重大的技术突破。?
5、整个大模型应用落地需要所有企业、所有行业一起结合自己的场景去做探索和实践。大模型本质只是基础的能力,要把他们调度起来,和业务目的和业务任务结合起来,才能产生实实在在价值和作用。
以下为嘉宾演讲实录(略有增减):
刚开年立马就看到一家厂商发布新的大模型,一年过去大模型还这么火,这是非常好的现象。说明每一家做基础大模型厂商在努力迭代基础能力,以及每一家做应用厂商都在积极努力去做基于大模型应用的拓展。
“生成式AI正在从第一幕向第二幕过渡”,这个观点是去年11月份红杉资本做出的判断。去年一年,大模型更多是作为一个新事物出现,大家觉得可用、挺好玩的,纷纷投入来尝试,并且基于业务场景做一些探索。
到2024年我们对大模型的判断是,进入实实在在落地应用的阶段,开启从“可用”到“好用”的转化过程。
我个人对大模型观点是什么呢?一定要在时空维度来看待大模型。
先说时间,从三五十年的时间尺度来看,今天的大模型还处在起步期,10年、20年再看今天大模型能力,肯定觉得它很幼稚。3个月前的大模型、今天大模型和3个月以后大模型也完全不一样,因为能力完全不同了。简单来说,3个月的时间就能完成从全科高中生到全科本科毕业生,甚至到全科硕士生的进化。今年我们能不能达到全科博士生的能力?这是我们期待的事情。从多模态能力来说,我们非常期待在生活和工作场景里完全达到甚至超越高智商个体的人对事物的理解,不论是图片还是视频的识读,还是人类更深层次的思考的理解,这些方面,我们期待基础大模型快速进化。
第二,从空间角度看大模型,从实际应用环境来看,我们需要的不仅仅是一个大模型,它应该是大模型体系。这应该是一个什么样的体系呢?我们有云端的基础大模型、有边缘大模型、有终端的大模型(手机端的大模型、电脑端的大模型、汽车端的大模型等),它是云边端、大中小不同模型协同起来,和之前开发出来MIS、ERP,亦或是确定式的人工智能能力,来集成整合成为体系之后,来服务业务管理和生产需要。要从时空角度整体看大模型,它不是静态的东西。
百度从训大模型、用大模型和做应用三个层次全面支撑伙伴和客户,过去半年多很多客户在平台上取得非常多的进展。
做基础大模型是非常艰难的事情,甚至对百度自身来说也是非常艰难的事情,因为这需要在很长时间尺度里咬着牙坚持去投入。从百度来说,往前数坚持超过十年的时间在人工智能领域投入,往后十年、二十年还需要矢志不渝地坚持,才可能把基础大模型做的非常好。我们更期待伙伴和客户在大模型之上结合场景做应用,真正在实际业务里面落地。
在更宏大的社会经济环境里,退后一步来看,最近有一个词比较火叫“新质生产力”,是去年9月份总书记提出来的,前一阵我看到黄奇帆市长对名词有比较详细的解读。我们且不论更深层次的解读,简单说,人工智能尤其是生成式人工智能一定是“新质生产力”的一部分,它和未来的可控核聚变、量子计算、智能化机器人,这些技术加起来将构成下一轮经济重新迸发活力的基础支撑体系和能力。人工智能是通用能力,“智”能,和“电”能、“核”能这些“能”是一样的,智能在千行百业可以润物细无声渗透进去,从后端生产、前端管理和服务各个领域,都可以发挥它的作用。?
下面简单谈一下百度过去三四个月里,我们在政府、金融、交通等等领域的基本进展。
我是做了20多年IT的人,从2006年开始做“数字城管”的项目,后来叫“一网通管”。当年比较痛苦的事情是整个城市管理系统更多是基于地理信息的数据、基于城市管理(城市部件、城市事件)的等结构化的数据来开展工作,这其中有大量文本数据、视频数据是用不起来的。之后随着阿里提出“城市大脑”的平台,以及进一步和人工智能结合之后,城市管理有了一定的进步,但事实上过去12年以来,城市管理领域没有发生真正意义上的飞跃。原因在于数据管理和融合,以及对数据理解和学习没有实现特别重大的技术突破。
到今天这个问题是有希望被解决掉的,我们真正意义上可以实现空间数据和非空间数据一体化,结构化数据和非结构化数据的一体化,实时监测的现势数据和库里的历史数据一体化的管理、理解、识别、调度,基于大模型的智慧化城市管理体系有希望在今天技术变革前提下发生。今天只是开始,我们已经开始了一些有益的探索。未来真正能够把所有数据打通,真正城市有了大脑,这个城市治理会很不一样。
第二看一下金融领域,金融是信息化非常先进的行业/领域,银行、证券、保险、金融从30年以前开始,一直基于信息化在构建、在发展。今天大模型出来之后,更多是从两个角度对它进行一定的提效,主要体现在基于大模型协同办公能力的提升,以及在智能投研、智能投顾、智能客服、智能业务办理等业务场景里面,大模型可以实实在在发挥作用。
下一个板块是工业,在“新质生产力”里黄奇帆市长说到新制造、新业务、新服务,工业是新制造的代表,目前来看是大模型比较难于很快进入并且发挥作用的领域。大模型有几个最基本的能力,理解、生成、推理、记忆,生成更多用到金融和政务里的办公辅助copilot,推理是形成调度管理能力。在工业领域,大模型的理解调度能力和实际业务结合、和历史应用结合,和历史上开发出来确定式AI结合,可以形成一体化管理调度的体系。我们在实际的场景里已经进行了一些探索。
工业是比较复杂的场景,这涉及到大模型更深度的使用,同时对大模型的能力提出了更高的要求。本质上说,如果不能做到很完善的多模态识别、理解,和基于识别理解结果与管理预案管理规则结合,做指挥调度的话,那可用性还是需要去提升的。
最后是汽车,汽车是比较典型的“端”的代表,有手机端、电脑端、有汽车端、XR端,这些端在未来不太长的时间里面会全面被大模型接入,基于云端大模型做调用,或者如果这些端本身具备比较好的GPU计算能力,像苹果马上要新出的VR设备(Vision pro),也可以在端侧做空间计算、甚至做基于大模型的计算都有可能。在汽车端,空间本来就是比较大的,所以它的硬件设备相对比较好,基于汽车端本身的大模型也是未来主要的战场/领域。
今天车辆智能驾驶系统相对比较简单,我们最多是通过它来问问路,来实现一些导航,未来可以把行车相关的所有的东西,就是车内设备情况、车外的道路情况和城市交通网的状况等等,这些信息都综合起来汇聚起来,形成深度智能化的能力。
百度做智能驾驶已经十年了,过去十年已经经历了三个阶段,从最初基于车辆比较简单的阶段到后来基于地图和车辆连接的,做知识图谱的阶段,以及今天基于大模型,实现车、路、云、图全体系融合的阶段。十年下来,我们已经可以看到智能车在北京、上海、深圳、武汉、重庆五个城市实际做试运行,叫萝卜快跑,大家有兴趣可以去试驾一下。虽然当下也面临城市基础设施、法律法规的挑战,还需要进一步成熟的过程,但它一定未来三五年会成为普遍现象。在此基础上我们也做了交通大模型,全面满足城市智慧交通管理的需要。
基于大模型的全面智能化的指挥调度,是我们期待的未来。虽然当下基本能力已经具备,但深入到每一个城市智能交通的建设,都需要和每个城市实际业务情况、实际数据情况结合起来。基础大模型进去要结合它的数据做专题训练,才可以具备刚刚提到的能力。
我们和吉利有全面的合作,会基于新能源技术、基于大模型来做全智能化汽车的辅助自动驾驶系统,这个体系下实现驾乘车、路、云、图的协同,实现真正意义上的智能交通。
最后,我想说的是,整个大模型应用落地需要所有企业、所有行业一起结合自己的场景去做探索和实践。大模型本质只是基础的能力,这好比我们雇佣了一群聪明的全科博士生到单位,他们能做什么还得培训,要把他们调度起来,和业务目的和业务任务结合起来,才能产生实实在在价值和作用。