Sam Altman 2023年11月22日 重回OpenAI 任CEO。
Sam Altman 2023年12月24日 发布新年需求统计。
OpenAI是一个美国人工智能研究实验室,由非营利组织OpenAI Inc,和其营利组织子公司OpenAI LP所组成。OpenAI 进行 AI 研究的目的是促进和发展友好的人工智能,使人类整体受益。
两个小时讨论,整理出以下需求清单,有6万多次需求回答。
AGI(Artificial General Intelligence) 通俗称为强人工智能或者通用人工智能。
AGI 能够胜任任何任务,智能水准比肩人类或者超过人类。
在这次讨论中,前2分钟 对于AGI 有非常明确需求,想要快速进入AGI时代。
Sam Altman 明确表示2024年无法实现这个目标。
OpenAI 公司战略目标AGI ,对于这个方向也在不断迭代,GPT就是为这个方向而诞生的。
GPT4.5 还不太确定,曾经传出12月底上市,Sam Altman 上个月曾透露正在研发GPT-5,具有更好多模态能力,优化加强文字,语音,视觉,视频等能力。
ChatGPT 语音功能现在已经向所有用户免费开放,它主要由 Whisper 模型提供支持。iOS 和 Android 的 ChatGPT 移动应用程序均提供该语音功能。
Whisper是一个端到端的语音识别系统,可将英语语音转录为文本。它通过Transformer架构,在680,000小时的语音数据上训练,达到接近人类水平的语音识别准确率和鲁棒性。
ChatGPT 只提供了五种不同的声音进行选择:Breeze、Ember、Cove、Juniper 和 Sky。
价格按1000个tokens计费,1个token约等于4个字符,所以1000个tokens约等于750个单词。
输入和输出分别计费,输入价格一般低于输出价格。例如GPT-4输入为0.03美元/1000个tokens,输出为0.06美元/1000个tokens。
不同模型价格不同,越大的模型价格越高。例如GPT-4价格比GPT-3.5 Turbo高出近10倍。
模型的使用分训练和预测两部分计费:
训练阶段按训练数据量计训练tokens数,以训练tokens价格计费。
预测阶段只按实际使用的输入和输出tokens计费。
图像生成定价主要参考分辨率和质量:
语音识别系统Whisper为0.006美元/分钟。
Sam Altman 在今年 11 月宣布的「GPTs 对所有 ChatGPT+ 订阅者开放」和首届开发者日上 OpenAI 宣布将推出的 GPT 商店,都是重要的里程碑。
GPTs面向所有plus用户使用
输入主题,定制logo。
微调提示词,微调助理定位,语气,是否专业,法律范围等等,提示词整合微调出结果。
上传知识库,进行解析,结合提示词能力。
Actions Zapier 能整合5000+插件扩展能力。
期待2024年 GPT Store 上市,把GPT 付费应用整合了,更好服务用户。
推力能力对于知识类挺强的,通过模板使用重复编辑,继续生成想要结果,对于创作类更多摘要式的或者关键词,还有与上传文件解析能力结合继续加强。
日常使用过程中,已经可以避免AI 伦理和违规生成,今年Sam Altman 做了这方面很多努力,例如全球巡演,继续使用迭代,有个担心发版时候会有阶段版本无法固化AI伦理和合规能力。
原生GPT现在没有视频处理能力,要加上处理能力得去GPTs Action中找外部插件引用才能间接使用。
现在个性化定制,有三种方式,一种设置里面有自定义提示词,一种API 微调,一种运用GPTs模板化处理。
API 微调门槛还是有的,需要处理结果数据,在线微调GPT。
GPTs 方式挺好用,不会写代码的也能使用,傻瓜式创建,知识库有限制,还有解析能力限制,比如上传图片解析能力就比较弱。
加强GPT联网能力,发现一个现象单独使用GPT-4 直接生成内容,内容比较详细,但是同样内容跳到联网搜索生成内容,就返回比较粗糙,这是因为联网整合能力还不够强大。
用oauth 协议三方登录,跟API付费能力结合,让OpenAI 用户可以实现到处登录,打通使用工具壁垒。
OpenAI 目前拥有超过 10 亿用户,也成为了历史上用户增长速度最快的产品。根据当前的统计数据,ChatGPT 当前拥有超过 1.8 亿用户,每周活跃用户数达到 1 亿。
llama 2 大模型开源为国内大模型市场提供了指导方向,证明大模型开源一种趋势,并不会产生不好影响,可以考虑开源GPT 这是呼声特别高的。
国内大模型发展就指望着GPT 和 llama 2 。
明年非常期待OpenAI 产品发布,促进世界技术发展,替代过时方式,释放人类的创意和创造力。