本人数据AI工程师,我的观点对全行业都有冲击,当AI大模型持续进化之时,没有一家公司能独善其身。
本文从产业架构上、论文体量、基础Pass能力、通用大模型、AI开源社区、业务属性大模型、内容消费工具、创作工具赛道、企业服务这些板块分析,与朋友们互相交流。
2023年是AI生成元年,每日都在影响世界。
关于AI生成冲击文艺方面方面的新闻,这属于产业分布,有的产业演化快,有的演化慢,一般下沉性产品演化都快,本来生命周期就5年,不快点就会破产,具体可以看文章产业分析。
AIGC : AI-Generated Content 指利用人工智能技术(生成式AI路径)来生成内容的新型内容生成方式。
GPT-4: 多模态大语言模型,输入输出不再局限于文本,具有推理感知能力,初步具有AGI能力。
AGI : 通俗称为强人工智能或者通用人工智能。AGI 能够胜任任何任务,智能水准比肩人类或者超过人类。
LLM:大型语言模型 (Large language model) 通俗来讲,语言模型就是一个可以分析和生成文本的人工智能系统。它通过学习大量文本数据,来理解人类语言的规则,知道哪些词语组合在一起才是合理流畅的。
arXiv:arXiv是一个收集物理学、数学、计算机科学、生物学与数理经济学的论文预印本的网站,成立于1991年8月14日。截至2008年10月,arXiv.org已收集超过50万篇预印本;至2014年底,藏量达到1百万篇。截至2016年10月,每月提交量超过10,000篇。
AI:人工智能(AI) 是一组技术,使计算机能够执行各种高级功能,包括查看、理解和翻译口语和书面语言、分析数据、提出建议等各种能力。
AI Agents: LLM Agent 是一种基于 LLM 的智能代理,它能够自主学习和执行任务,具有一定的“认知能力和决策能力”。LLM Agent 的出现,标志着LLM 从传统的模型训练和应用模式,转向以 Agent 为中心的智能化模式。
我们做通用大模型的目标是GPT-4。例如:文心一言,通义千问等等。
我统计了2023年迄今arXiv上发表的AI相关论文数量:
综合统计,2023年1月1日至今,arXiv上发表的与人工智能相关的论文总量约为7000篇。
AI研究正在以指数级增长的方式产出新的理论、方法和应用。
图片概述了构成AI驱动任务所需的各个层面的大语言模型(LLM)基础架构。该架构包含:
每个层面都代表了LLM生态系统中的一个关键组成部分,从 初始的数据处理到最终输出传递,都可以确保模型高效运行。
模型基础能力,包括语言理解与生成、知识理解与应用、专业能力和环境适应与安全性,进而细化为10项基础能力。
显示了各个行业的增长,其中以最高的条形代表的某个特定行业预计增长最大。
多模态融合方案增长最快,具体应用以数字人为主,流量为王时代,视频激发数字人快速增长。
我们前面讲解完LLM基础,咱们基于产业图谱把整个架构补全
2028年,中国AIGC产业规模预计将达到7202亿元,中国AIGC产业生态日益稳固,完成重点领域、关键场景的技术价值兑现,逐步建立完善模型即服务产业生态,2030年中国AIGC产业规模有望突破万亿元,达到11441亿元。
相信通篇下来,我们感受到其实对上下游影响都很大,文艺方面消费级应用,根据产业热点比例占据中等行列,并不是最高。
AI生成是时代奇点,每日都在变革,按照这个顺序在延申。
我是dlimeng,独立开源软件开发者,SolidUI作者,对于新技术非常感兴趣,专注AI和数据领域,如果对我的文章内容感兴趣,请帮忙关注点赞收藏,谢谢!