tree -L 1 -I "__pycache__"
.
├── actions
├── _compat.py
├── config.py
├── const.py
├── document_store
├── environment.py
├── __init__.py
├── inspect_module.py
├── learn
├── llm.py
├── logs.py
├── management
├── manager.py
├── memory
├── metagpt_memory.svg
├── prompts
├── provider
├── roles
├── schema.py
├── skills
├── software_company.py
├── subscription.py
├── team.py
├── tools
└── utils
可以看出核心模块是:
metagpt.actions
metagpt.docutils_store
metagpt.learn
metagpt.memeory
metagpt.prompts
metagpt.provider
metagpt.roles
metagpt.skills
功能模块是:
metagpt.utils
metagpt.tools
metagpt.config
metagpt.schema
metagpt.logs
metagpt.const
metagpt.environment
metagpt.subscription
metagpt._compat
metagpt.team
metagpt.software_company
metagpt.manager
metagpt.management
根据官方视频的介绍:
Actions是大语言模型的行为,Review是一个行为,不是一个工具。
Documents Store是聚拢所有智能体输入键的地方。
Learn模块需要解决标准化学习流程和复用流程的问题。
Management模块可以实现智能体的自动化生产和管理。
Memory模块类似于人类的短期记忆和长期记忆。
Provider模块用于调用第三方API。
role并不局限多智能体,随着场景,角色不一样
Utils模块包含了一些工具和API。
Environment模块提供了一个有记忆的环境。
视频内容总结:相比于langchain是一个比较薄的设计,能做到很多兼容,确实方便入手。
智能体的定义是在大语言模型之上,加上记忆、规划、工具、神经、直觉
多智能体是智能体加上环境、SOP、评审、路由、订阅、经济
智能体可以代替人类使用货币,采购其他智能体的服务,组成公司来赚钱
神经需要精确实现以应对现实世界的不同场景和任务
直觉模型是解决直觉问题的模型
规划和思考是人类独有的能力,智能体需要在环境中进行协作
数字世界中智能体之间的交互是一跳的,速度比人类快
使用多智能体而不是单智能体的原因是单智能体有并发上限
智能体之间的协作需要有一个返回闭环,包括SOP、评审和路由等
智能体的输出量有限,需要一个完整的抽象来实现长程输出
智能体是一个物种,可以在各种地方存在,它需要硬件和电力来维持生存。
80%的工作中的20%的技能可以被大型模型完全曝光和暴露。
编程的暴露度很高,如果智能体能够完全接管编程,将带来很多好处。
代码具有逻辑性和结构性,大型模型可以学习和推理逻辑。
最终目标是让智能体进行自我优化,可以通过建立Agent Store和MG来实现。
个人总结:智能体模仿人类已经迈出了踏实的一步。