2023年被视为人类科技史上的一个重要年份,可能标志着新一轮工业革命的开端。这一年,科技领域发生了多项重大事件,它们围绕三个核心主题展开。其中,最引人注目的主题之一是人工智能,特别是由硅谷的创业公司OpenAI在2022年11月30日发布的基于GPT-3.5模型的聊天机器人ChatGPT。这个聊天机器人能够以人类的方式进行多轮对话,并协助完成写邮件、写论文、编写代码等任务。它的发布引发了广泛关注,例如12月3日一位工程师绕过了安全限制,使用GPT编写了一份毁灭人类的计划书和配套代码,引起轰动。到了12月5日,OpenAI的高管Sam Altman宣布ChatGPT的用户数量突破了100万,仅仅在发布后的5天。12月21日,英矽智能的创始人兼CEO亚历克斯·扎沃龙科夫博士在一篇科学论文中探讨了雷帕霉素的抗衰老应用,而ChatGPT是这篇论文的共同作者。2023年1月17日,微软CEO纳德拉宣布将ChatGPT整合到微软的所有产品中。到了1月底,ChatGPT的用户超过了1亿,超越了TIKTOK,成为历史上增长最快的消费级软件。这些事件预示着未来将有更多值得关注的行业快速变化。
AI领域诞生了第一个具有现象级影响的产品ChatGPT,标志着一个从边缘到主流的转变故事。这个产品的爆火,实际上是一个从默默无闻到高度关注的逆袭故事。AI在最初的研究阶段主要专注于让机器理解和使用人类语言,这在专业领域被称为自然语言处理(NLP),一个历史悠久的研究领域。中国自上世纪80年代就开始了语音识别和机器翻译技术的研究,并将其初步应用于军事和国防领域。到了1992年,中国发布了一本关于机器翻译的著作,这在某种意义上标志着AI历史上第一次听到了来自中文世界的声音。随着技术和产业的发展,语言识别技术逐渐融入我们的日常生活。人们开始使用简单的语言指令与智能设备交互,例如使用iPhone的Siri和天猫精灵等智能音响来设置闹钟或发送短信。然而,那时的AI并不能真正理解人们所说的话,它们仅仅是对话进行分类,而不是深入理解。
从2017年开始,AI领域发生了显著的变化。谷歌的机器翻译团队发表了一篇论文《Attention is All You Need》,首次提出了Transformer架构,旨在取代传统的机器学习技术,引起了业界的广泛关注。到2018年,基于Transformer架构的自然语言模型开始出现,其中最受关注的是谷歌发布的BERT和来自不起眼的一家创业公司OpenAI的GPT模型。
谷歌和OpenAI虽然都采用了Transformer架构,但它们训练模型的方式有所不同。谷歌的方法类似于我们小时候做的英语完形填空题,通过遮住一些单词来让模型猜测这些单词,从而理解句子。而OpenAI的方法更像是让模型阅读文章,然后写出类似的内容,这种方法假设如果模型能写出类似的文章,那么它可能已经理解了文章的内容。
大多数公司,包括许多中国公司,选择了追随谷歌的BERT路径,因为这种方法对于小型业务场景,如电商公司的客服机器人,可以快速达到不错的效果。然而,当时并没有太多公司考虑打造一个真正全能的AI。OpenAI的GPT模型一度被谷歌嘲笑,因为这条路看上去既辛苦又愚蠢。但当OpenAI坚持不懈地提升GPT模型的参数量时,出现了所谓的“涌现”现象——AI突然展示出没有明确编程或预期的新能力。例如,GPT-3的能力超出了人类的科学解释范畴,它能够基于其对天文、计算机、文学等不同领域知识的理解来创作全新的故事。至2020年,GPT-3问世,展现出前所未有的能力。GPT-4的参数量据说远超1万亿,相较之下,其他大型模型的参数量显得微不足道。
在AI领域,开发和维护拥有巨大参数量的大型模型成本极高。以GPT-4为例,它每次训练的成本约为6300万美元,相比之下,BERT模型的训练成本通常在几万到十几万美元之间。
随着GPT-3的爆火,2023年AI行业的竞争迅速升温。在2023年2月,微软宣布将ChatGPT集成到其搜索引擎Bing中,并在3月发布了Office 365 Copilot,使得这些传统办公软件变得更加先进。与此同时,匆忙追赶的谷歌也在2023年3月发布了他们的新型大模型,以及与GPT-3相对标的产品Bard。不过,他们的发布会并不是很顺利。此外,全力投入元宇宙的扎克伯格也忙碌着,在2023年2月和7月分别发布了产品LLAMA和LLAMA2。LLAMA可以直接部署到我们自己电脑上免费用的大模型。
另外一家名为Anthropic的公司,由之前在OpenAI主要负责AI安全性和道德的科学家创立,旨在确保AI的行为与人类价值观保持一致。Anthropic也在2023年3月推出了他们自己的产品Claude,与GPT-3相竞争。到年底,喜欢炒作的马斯克也加入了战局,在他重新命名的Twitter平台上发布了他的新型产品Grok。马斯克称这个模型比ChatGPT更幽默,但目前据观察它的中文能力相对较弱。