很多机器学习框架和类库都是使用Python编写的,OpenAI提供的很多例子也是Python编写的,所以为了方便学习,我们这个教程也使用Python。
Python环境搭建有很多种方法,我们这里需要使用 Python 3.10 的环境,如果你已经具备或者自己很清楚怎么搭建,请跳过这个小节。
Anaconda 可以简单理解为一个软件包管理器,通过它我们可以方便的管理Python运行环境。
Anaconda 的官方下载地址是:https://www.anaconda.com/download,页面如下图所示:
请注意选择你使用的操作系统,整个安装包有800多M,下载时间取决于你的网路。
Anaconda 的安装比较简单,但是安装中间还需要下载很多程序,所以需要的时间可能会久一点;另外全部安装完毕后,可能会占用5G多的硬盘空间,需要提前预留好。
Anaconda 集成了一些方便的工具,安装完成后,我们可以使用 Anaconda Navigator 来启动它们。在Windows系统下,我们可以在开始菜单中找到这个 Anaconda Navigator,就是下面图片中的这个。
启动 Anaconda Navigator 后,在右边的应用列表中找到 JupyterLab。
JupyterLab 是一个Web的交互式计算窗口,能在网页中运行Python程序,可以省掉很多麻烦。
启动后,窗口界面如下所示。左边是当前用户的根目录,右边有一些功能入口,我们先不管。
我们在左侧根目录下点击右键创建一个文件夹:gptdemo,名字可以随便起,后边我们的程序都放到这里边。
然后我们双击进入 gptdemo,再点击右键创建一个 Notebook,Notebook 可以记录文字、编写代码并执行。
在左侧文件夹中双击新创建的Notebook,它会在右侧编辑区打开,在工具栏的“Cell Type”中选择“Code”,然后点击工具栏前边的加号(+),Notebook中就会自动创建一个代码Cell,这种Cell既可以运行Python代码,也可以执行各种Shell指令。
执行下边的命令,安装openai的python sdk。
pip install --upgrade openai httpx[socks]
这个只需要安装成功一次就行了。
下图是JupyterLab中的命令执行效果演示:
下边进入本文的重点,运行一个GPT程序。
在这个程序中,我们还是让 GPT 扮演一个善于出题的小学数学老师。
可以先把下边的代码粘贴到你的开发环境中运行一下,后面我会解释各个参数。
注意替换 api_key,没有的可以去注册一个或者找人购入一个。
from openai import OpenAI
client = OpenAI(api_key='sk-xxx')
stream = client.chat.completions.create(
messages=[{
"role": "system", "content": "你是一名数学老师,从事小学数学教育30年,精通设计各种数学考试题"
},{
"role": "user", "content": "你是谁?请以json返回"
}],
model='gpt-3.5-turbo-1106',
max_tokens:1024,
#temperature=0.1,
top_p=0.3,
#frequency_penalty=0.5,
presence_penalty=0.2,
seed=12345,
#stop='30年',
response_format={ "type": "json_object" },
n=1,
stream=True
)
for chunk in stream:
msg = chunk.choices[0].delta.content
if msg is not None:
print(msg, end='')
我们需要先创建一个客户端:client = OpenAI(api_key='sk-xxx'),注意替换其中的 api-key。
然后我们使用 client.chat.completions.create 来创建一个聊天 Completion。Completion这个单词怎么理解呢?这有点类似搜索框中的那种联想输入,我们输入部分字符,它就会生成一组补全的查询词语列表,这个技术叫:Auto Complete。
因为很多参数都涉及到Token的概念,所以在开始介绍参数之前,我们先来理解下 Token 这个概念。
在大模型中,模型的输入和输出实际都是Token。Token不是完全对照到单词或者字符的,大模型处理数据时,文本会被切分成单个元素或标记,也就是Token,这些Token可能是单词、字符或单词的一部分。
大模型使用Token而不是直接使用单词或字符的原因主要是效率、灵活性和性能的问题。例如大词汇表会导致模型参数数量剧增,增加内存需求和计算成本,而使用子词可以降低词汇表的大小,特别是含有大量专有名词的语料库,同时子词还可以避免单个字符携带信息可能过少,导致需要处理更长序列才能理解文本的问题。另外子词对于一些语言还具备跨语言表示的能力,子词还可以让模型更好地学习和理解单词的形态变化和复杂的词形构造规则。
比如对于这个句子:I don't like cats.
其拆分后的Token序列可能是:["I", "do", "n't", "like", "cats", "."]
注意,不同的模型可能会采用不同的切分方法。
然后我们看下这几个参数:
看下这个运行效果吧:
以上就是本文的主要内容,GPT编程是不是挺简单的?!
后续我还会继续分享图片、插件、语音等API的使用方法。
关注萤火架构,加速技术提升!