AIGC是什么?从Eliza到Chat GPT-4的技术革命

发布时间:2023年12月26日

当我们在谈论诸如GPT-4这样的大型语言模型时,我们谈论的是什么?我们讨论的不仅是算法的复杂性,而是一种全新的可能性。内容创作、客户服务、软件开发和数据分析等等行业在AIGC的浪潮中被重新解构。这不仅仅是一场简单的技术革命,它是对现有商业模式、创意表达和日常交流方式的重新定义!

所以你准备好和我们近屿智能OJAC一起来迎接这场AIGC的革命了吗?那就加入我们AIGC星辰大海:大模型工程师与产品专家深度训练营。我们来教您怎么做预训练,怎么做数据清洗,怎么做数据标注,怎么做增量预训练和微调大模型以及开发软硬件AI产品。

罗马不是一日建成的,今天我们先建立对大模型的初步认知,从ChatGPT的诞生开始讲起。

早在1950年,当艾伦·图灵在《计算机器与智能》设计了一个模仿游戏(图灵测试)时,他可能没有想到他的研究将如何深刻地影响未来计算机科学与人工智能领域。图灵测试不仅是对机器智能的一种理论评估,它更是对人类认知的挑战,因为它提问了一个根本性的问题:机器能像人类一样思考吗?

而这个问题催生了对话语言模型的研究,这也是现在ChatGPT的前世雏形,1966年,麻省理工学院的Eliza对话机器人就是对这一问题的早期回应。Eliza的原理基于一种早期的自然语言处理(NLP)技术——模式匹配(pattern matching)。这种技术依赖于一个静态的脚本系统,这个系统存入了一系列预先定义的输入模式和它们对应的输出响应,这个系统可以被看作是条件语句的集合,例如 if...else...语句,正是这类语句定义了如何根据输入选择适当的输出响应。

Eliza机器人程序内预先设定一些触发特定响应的关键词,在用户输入文本后,Eliza机器人会扫描这些文本寻找关键词。例如,如果用户的输入包含单词“头疼”,Eliza可能会寻找与“头疼”相关的预先定义输入模式,并生成一个设计好的输出响应,如 “也许你需要一个医生”。Eliza的数据库中存储了许多类似的数据集合。这背后大概是200个固定的匹配规则在起作用。它使用关键词匹配和预先设定的脚本来生成对话,常常给用户一种与心理治疗师交谈的错觉。

Eliza的设计目的是为了模拟人类的对话,但并没有真正理解对话内容。尽管它看起来像是在进行有意义的交流,实际上它只是在应用一个相当原始的技术来模拟这种交流。

20世纪末,N-gram模型逐渐成为了语言模型的主流。N-gram是一种基于统计的方法,比起pattern matching它可以通过分析文本中固定长度(N)的词序列来预测下一个词出现的概率。例如,一个双词组(bigram)模型将考虑每个词和其前一个词的组合,而一个三词组(trigram)模型将考虑每个词及其前两个词的组合。字符串的概率如

但是因为受限于字符串组合的可能性,样本稀疏,语言模型还是难以学习较长的上下文。

RNN(循环神经网络)的网络结构中存在着循环,这使得它能够将序列的先前信息传递到序列的后续处理中。简单来说,RNN在处理一个序列的当前元素时,它的输出不仅依赖于当前输入,还依赖于先前元素的信息。它解决了N-gram的局限同时又产生了新的问题,在长序列的处理中,RNN容易遇到梯度消失或爆炸的问题,这会导致信息传递的遗忘,这使得模型难以学习和保持长期依赖关系。

2017年 Google研究的Transformer架构(自注意力机制)横空出世,Transformer彻底改变了NLP的游戏规则。它通过自注意力机制,允许模型直接关注序列中任何部分之间的关系,解决了RNN在处理长距离依赖时的问题。它的原理是让模型在处理序列的每个元素(比如一个句子中的每个词)时,能够同时考虑到序列中的所有其他元素。这种机制使得每个词不仅仅与其相邻的词相关联,而且还与整个句子中的其他词相关联。

可以这样想象,你正在阅读一本书,并试图理解一个复杂的句子。为了完全理解这个句子,你除了需要注意到当前阅读的词,还需要记住句子中先前的词,甚至可能需要预测接下来的词。自注意力机制正是模仿了这种阅读和理解的过程。

如今Transformer结构的网络变体在2017年以来层出不穷,但最终被采用的基本结构仍然是最初版本。Transformer架构是自然语言处理领域的一个里程碑,它通过自注意力机制提供了一种高效而灵活的方式来理解和生成语言,而也是当前大规模预训练模型Chatgpt的基本架构,由此揭开了AI大模型在语言理解方面崭新的篇章!

AI语言处理技术的演进

经过这些认识,回到我们的标题,AIGC是什么?AI Generated Content,利用人工智能技术生成的不同类型的内容,AIGC的迅猛发展正是我们人工智能技术,从模式匹配pattern matching)到transformer结构不断发展并应用的表现。

相信通过上述这些知识点,你已经对AI大模型有了一个宏观的初步认知,这也是我们近屿智能OJAC的第五期AIGC星辰大海:大模型工程师与产品专家深度训练营课程内容中的吉光片羽,我们诚挚邀请您加入我们线上训练营的免费试听课,一起走向属于我们的星辰大海!

在我们正式课程内容中我们还探讨Google与openAI,GPT 和 BERT的路线之争,并带大家一起和GPT互动,解锁后续知识内容,请持续关注、评论 、点赞、收藏文章,加入我们OJAC近屿智能AIGC星辰大海:大模型工程师与产品专家深度训练营,免费获取更多AI学习资料!掌握更多AI技能,下期见!

欢迎浏览器搜索“AI得贤招聘官”官网,点击“AIGC大模型培训”页面,联系我们报名,对这部分内容感兴趣还可直接评论私信我获取资料~

文章来源:https://blog.csdn.net/Oven_OJAC/article/details/135230518
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。