2023年3月10日
最近科技圈的消息感觉都要爆炸了
我们都知道
如今爆火的ChatGPT
是在GPT3.5的基础上改进得来的
而OpenAI很早就预告
GPT-4将会在今年发布
不过最近各家大厂争相入局的行动
似乎加快了这个进程
最新消息是
万众期待的GPT-4将于下周推出
在3月9日
微软德国
举行的一场线下活动中
四名微软德国员工
展示了GPT系列
等大型语言模型的颠覆性力量
以及OpenAI技术应用的详细信息
在活动中
微软德国首席技术官
安德烈亚斯·布劳恩(andreas braun microsoft)
表示
GPT-4即将发布
自从3月初
多模态模型Kosmos-1
发布以来
微软一直在测试和调整
来自OpenAI的多模态模型
布劳恩说道
我们将在下周推出GPT-4
它是一个多模态的模型
将提供完全不同的可能性
例如视频
(的生成能力)
他将语言大模型
形容为游戏规则的改变者
因为通过这种方法
人们可以让机器理解自然语言
而机器就能够以统计的方式
理解以前只能由人类
阅读和理解的内容
与此同时
这项技术已经发展到
基本上适用于所有的语言
比如你可以用德语提问
然后用意大利语得到答案
借助多模态的技术
微软和OpenAI
将使模型变得更加全面
微软德国公司首席执行官
玛丽安·贾尼克(Marianne Janik)
全面谈到了
人工智能对业界的颠覆性影响
贾尼克
强调了人工智能的价值
创造潜力
并且表示
当前的人工智能发展和ChatGPT
是像iPhone发布一样的时刻
她表示这不是要代替人类工作
而是帮助人们
以不同于以往的方式
完成重复性的任务
贾尼克强调说
改变并不一定意味着失业
而是意味着许多专家会开始利用AI
来实现价值增长
传统的工作行为正在发生变化
由于新的可能性的出现
也会产生全新的职业
她建议公司成立内部的能力中心
培训员工使用人工智能
并将想法整合到项目
中
此外贾尼克还强调
微软不会使用客户的数据来训练模型
但是注意
根据ChatGPT的政策
OpenAI可能会这么做
微软的两位AI技术专家
克莱门斯·西贝尔
和霍尔格·肯恩
提供了关于AI实际使用的一些信息
他们的团队目前正在处理具体的案例
他们也讲解了案例所涉及的技术
肯恩
解释了什么是多模态人工智能
他不仅可以将文本相应的翻译成图像
还可以翻译成音乐和视频
除了GPT 3.5的模型之外
他还谈到了embeddings
用于模型中文本的内部表征
根据肯恩的说法
"负责任"的AI
已经内置到微软的产品中
并且可以通过云服务
将数百万个查询映射到API中
西贝尔则用案例说明了
今天已经成为可能的事情
例如可以把电话呼叫的语音
直接记录成文本
根据西贝尔的说法
这可以为微软在荷兰的一家大型客户
每天节省500个工作小时
而这家客户每天要接到3万个电话
这个项目的原型
是在两个小时内创建的
仅仅由一个开发人员在两周内完成
根据他的介绍
三个最常见的案例是
回答只有员工才能访问的公司信息
AI辅助文档处理
以及在呼叫中心的口语半自动化处理
此外微软还表示
人们很快就会与全新的AI工具
见面
特别是在编程领域
Codex
和Copilot
等模型可以更轻松地创建代码
令人期待
当被问到操作的可靠性
和事实保真度
时
西贝尔表示
AI不会总是正确回答
因此有必要进行验证
微软目前正在创建
置信度指标
来解决这个问题
通常客户只需要在自己的数据集
上
使用AI工具
主要用于阅读理解和查询库存数据
在这种情况下
模型已经相当准确了
然而
模型生成的文本仍然是生成性的
因此不容易验证
西贝尔表示
微软围绕生成型AI
建立了一个反馈循环
包括赞成和反对
这是一个迭代的过程
在AI大模型的竞争中
微软最近也加快了脚步
在过去的一周左右时间
微软接连发布了
展示多模态的语言大模型论文
Kosmos-1 和 Visual ChatGPT
显然它非常支持多模态
而且希望能够做到
让感知与大语言模型保持一致
这样一来
就能够让单个AI模型
实现看字说话
和看图说话
巧的是
Google前两天也发布了一个
5,620亿参数的超大模型PaML-E
甚至连机器人都能使用
也在学术圈引发了不小的热议
微软的下次AI活动选在了3月16日
CEO萨蒂亚·纳德拉
将亲自上台演讲
不知道是否会在这次活动上
发布GPT-4
有趣的是
微软的活动和百度推出文心一言
选在了同一天
最近有报道称
百度正在抓紧时间
赶在3月16日推出文心一言
这是一个类似于ChatGPT的
聊天机器人
目前来看
百度打算分阶段的推出
文心一言的各项功能
并首先向部分用户开放公测
知情人士称
在春节假期
过后
李彦宏
就要求
包括自动驾驶部门
在内的
全公司AI研究团队
将英伟达A100
支援给文心一言的开发
我们期待
下周各家科技公司
能够带来更多的惊喜