用一个开源项目在数字世界建一座平行城市让成千上万个 AI 角色在里面生活、争吵、形成共识——然后你就能看到未来。读完本文你将了解多智能体模拟的核心原理 | 5 步部署 MiroFish | 群体智能引擎的架构设计 | 这东西到底有没有用 这个项目解决什么问题你有没有遇到过这种情况公司要推一个新策略你不知道用户会怎么反应或者你追了一部没写完的小说特别想知道作者原本想怎么写结局传统的预测方式无非两条路找专家分析或者训练 ML 模型。但专家的认知有局限ML 模型只能处理结构化数据——当你要预测的是一个社会事件如何发酵或者100 万人对一个政策会有什么反应时两个方案都力不从心。MiroFish 做的事情简单说就是把一群人AI 智能体扔进一个数字沙盘让他们自由互动然后观察会涌现出什么。它不是另一个 LLM 套壳。它的核心思路来自群体智能Swarm Intelligence——个体的简单行为在群体层面产生复杂模式就像蚂蚁个体笨但蚁群聪明。MiroFish 把这个概念搬到了 AI 多智能体系统中。技术上它建立在两个关键基础上**OASISCAMEL-AI 的开源社交媒体模拟框架**提供智能体交互引擎Zep提供长期记忆和图谱存储。基于此前 1000 个智能体在模拟环境中进行几十轮对话交互从个体行为涌现出群体共识。截至目前GitHub 65K Star获得盛大集团战略投资孵化已经有多个真实演示案例武汉大学舆情推演、红楼梦失传结局预测。 快速上手环境准备# 确认 Node.js 版本node-v# 需要 18# 确认 Python 版本python--version# 需要 3.11.x 或 3.12.x# 安装 uv 包管理器curl-LsSfhttps://astral.sh/uv/install.sh|sh克隆并配置gitclone https://github.com/666ghj/MiroFish.gitcdMiroFish# 配置 API Keycp.env.example .env编辑.env填入两个关键 API# LLM——推荐阿里百炼的 qwen-plus性价比高效果够用 LLM_API_KEYsk-xxxxx LLM_BASE_URLhttps://dashscope.aliyuncs.com/compatible-mode/v1 LLM_MODEL_NAMEqwen-plus # Zep Cloud——长期记忆和图谱存储免费额度够用 ZEP_API_KEYzep_xxxxx⚠️踩坑提醒MiroFish 的 Token 消耗很大一个完整的 40 轮模拟可能花掉几十块的 API 费用。建议先用 5-10 轮的短模拟测试确认效果满意再跑完整版。一键安装启动npmrun setup:all# 安装前后端所有依赖npmrun dev# 同时启动前端 3000 后端 5001打开http://localhost:3000上传种子材料一段新闻文本、一份数据报告或者哪怕是几章小说用自然语言描述你想预测什么——然后等着看一群 AI 在你的沙盘里开派对。⚙️ 技术原理为什么一千个 AI 角色比一个 AI 准普通 LLM 预测是单线程的你问一个问题它给你一个答案。但社会现象不是一个人能算出来的——从众效应、信息级联、少数派观点发酵这些东西只有群体互动才会出现。MiroFish 的核心设计是基于智能体的社会模拟Agent-Based Social Simulation, ABSS五步走种子材料新闻/报告/小说图谱构建实体抽取关系识别人设生成千人千面角色创建平行模拟OASIS引擎驱动对话报告生成ReportAgent分析结果深度交互与任意角色/报告对话第一步图谱构建。系统把种子材料喂给 LLM提取出关键实体人物、组织、事件和关系存入 Zep Cloud 的图数据库。同时为群体注入初始集体记忆——相当于给每个智能体一个共同的知识基线。第二步人设生成。这是最精彩的部分。系统不是创建 1000 个一模一样的 AI而是根据种子材料自动推断这个世界里可能有哪些类型的人。比如在一个舆情推演场景中它会生成激进派大学生“谨慎的校方领导”“吃瓜群众”专业媒体人等不同角色每个有不同的立场、知识面和表达风格。第三步平行模拟。OASIS 框架接管——一个专为社交媒体模拟设计的引擎管理着成千上万智能体之间的对话交互。智能体会根据自己的人设和记忆选择跟谁聊“聊什么”。关键的涌现机制在这里当一个有影响力的智能体说完其他人会根据社会关系网络做出反应——转述、质疑、赞同、歪曲——信息在传播中变形共识在争议中形成。第四步报告生成。模拟结束后一个专门的 ReportAgent 带着丰富的工具集进入模拟后的世界对所有的对话记录、关系网络、情绪时间线做分析生成结构化预测报告。 LLM API Zep Cloud️ OASIS引擎⚙️ 后端️ 前端 用户 LLM API Zep Cloud️ OASIS引擎⚙️ 后端️ 前端 用户loop[每轮交互]上传材料预测需求POST /api/graph/build实体抽取关系识别结构化图谱数据存储图谱初始记忆启动模拟(智能体数量/轮数)智能体决策(跟谁聊/说什么)回复内容更新记忆模拟完成(全部对话记录)ReportAgent生成报告结构化预测报告报告交互接口与任意智能体对话/追问第五步深度交互。这是 MiroFish 区别于普通输入-输出式 AI 工具的地方。你可以点击模拟世界中的任意一个角色跟 Ta 单独对话也可以跟 ReportAgent 继续追问。你不是在看一份报告——你是在探索一个平行宇宙。️ 架构分析MiroFish 的代码结构相当清晰前后端分离核心服务模块化MiroFish/ ├── frontend/ # React Vite 前端 ├── backend/ │ ├── app/ │ │ ├── api/ # Flask 路由层 │ │ │ ├── graph.py # 图谱构建 API │ │ │ ├── simulation.py # 模拟控制 API │ │ │ └── report.py # 报告 API │ │ ├── services/ # 核心业务逻辑 │ │ │ ├── graph_builder.py # 实体提取图谱构建 │ │ │ ├── ontology_generator.py # 人设生成 │ │ │ ├── oasis_profile_generator.py # 转化为OASIS配置 │ │ │ ├── simulation_runner.py # 模拟编排 │ │ │ ├── report_agent.py # 报告生成智能体 │ │ │ └── zep_* # Zep记忆/图谱服务 │ │ └── models/ # 数据模型 │ └── pyproject.toml └── docker-compose.yml设计亮点OASIS 作为模拟引擎——MiroFish 没有重新发明轮子而是站在 CAMEL-AI 团队的肩膀上。OASIS 专门为社交媒体模拟设计已经处理好了智能体管理、时间推进、关系网络等底层问题。MiroFish 团队把精力集中在上游的种子材料处理和下游的报告生成上这是聪明的工程技术选择。Zep Cloud 的记忆分层——不是简单的向量数据库Zep 提供的是用户记忆 知识图谱 时序记忆的三层架构。在模拟中智能体的短期对话记忆和长期人格记忆被分别存储这让智能体既能记住刚才聊了什么又不会丢掉自己是什么人。双平台模拟——从 API 设计来看模拟支持双平台并行意味着你可以在不同的参数配置下同时跑两场模拟然后对比结果——这对做假设检验“如果主流媒体介入会怎样”非常有用。不够好的地方Token 消耗没有内置的预估和控制机制新手很容易跑完一场模拟才发现烧了几十块钱模拟过程中的状态可视化还比较弱前端只展示结果过程中发生了什么完全黑盒中文智能体的对话质量有时会崩——角色的人设会飘移比如谨慎的领导突然变得像营销号小编这和底层 LLM 的指令遵循能力有关✅ 优缺点 适用场景三个优点真·涌现效应——不是让 LLM 直接回答预测问题而是让智能体互动产生涌现结果这在底层方法论上是对的上手快——两个 API Key 一行安装命令就能跑没有复杂的自建服务依赖案例真实可靠——武汉大学舆情和红楼梦推演都有完整的 B 站演示视频不是 PPT 项目两个缺点成本不透明——没有 Token 预估没有费用提示模拟花费全靠跑完才知道对种子材料敏感——输入质量直接影响输出质量没有内置的材料质量评估谁应该立刻试试在做舆情分析、政策研究、市场调研的团队小说作者/内容创作者想推演自己的世界观对多智能体模拟技术感兴趣的研究者谁应该再等等只想要一句话预测的用户——MiroFish 太重了ChatGPT 就够了预算敏感的开发者——OASIS Zep LLM 三块费用叠加个人使用成本不低需要高精度金融预测的场景——群体智能在金融预测上的方法论还不够成熟MiroFish 让我看到多智能体模拟正在从学术走向工程化。它不是又一个 LLM 套壳而是用让 AI 互相对话的方式回答那些单靠预测模型无法回答的问题。如果能解决成本控制和过程可视化的问题这条路大有可为。
我让一千个 AI 模拟了武汉大学舆情,结果比真人预测还准
发布时间:2026/6/8 12:46:25
用一个开源项目在数字世界建一座平行城市让成千上万个 AI 角色在里面生活、争吵、形成共识——然后你就能看到未来。读完本文你将了解多智能体模拟的核心原理 | 5 步部署 MiroFish | 群体智能引擎的架构设计 | 这东西到底有没有用 这个项目解决什么问题你有没有遇到过这种情况公司要推一个新策略你不知道用户会怎么反应或者你追了一部没写完的小说特别想知道作者原本想怎么写结局传统的预测方式无非两条路找专家分析或者训练 ML 模型。但专家的认知有局限ML 模型只能处理结构化数据——当你要预测的是一个社会事件如何发酵或者100 万人对一个政策会有什么反应时两个方案都力不从心。MiroFish 做的事情简单说就是把一群人AI 智能体扔进一个数字沙盘让他们自由互动然后观察会涌现出什么。它不是另一个 LLM 套壳。它的核心思路来自群体智能Swarm Intelligence——个体的简单行为在群体层面产生复杂模式就像蚂蚁个体笨但蚁群聪明。MiroFish 把这个概念搬到了 AI 多智能体系统中。技术上它建立在两个关键基础上**OASISCAMEL-AI 的开源社交媒体模拟框架**提供智能体交互引擎Zep提供长期记忆和图谱存储。基于此前 1000 个智能体在模拟环境中进行几十轮对话交互从个体行为涌现出群体共识。截至目前GitHub 65K Star获得盛大集团战略投资孵化已经有多个真实演示案例武汉大学舆情推演、红楼梦失传结局预测。 快速上手环境准备# 确认 Node.js 版本node-v# 需要 18# 确认 Python 版本python--version# 需要 3.11.x 或 3.12.x# 安装 uv 包管理器curl-LsSfhttps://astral.sh/uv/install.sh|sh克隆并配置gitclone https://github.com/666ghj/MiroFish.gitcdMiroFish# 配置 API Keycp.env.example .env编辑.env填入两个关键 API# LLM——推荐阿里百炼的 qwen-plus性价比高效果够用 LLM_API_KEYsk-xxxxx LLM_BASE_URLhttps://dashscope.aliyuncs.com/compatible-mode/v1 LLM_MODEL_NAMEqwen-plus # Zep Cloud——长期记忆和图谱存储免费额度够用 ZEP_API_KEYzep_xxxxx⚠️踩坑提醒MiroFish 的 Token 消耗很大一个完整的 40 轮模拟可能花掉几十块的 API 费用。建议先用 5-10 轮的短模拟测试确认效果满意再跑完整版。一键安装启动npmrun setup:all# 安装前后端所有依赖npmrun dev# 同时启动前端 3000 后端 5001打开http://localhost:3000上传种子材料一段新闻文本、一份数据报告或者哪怕是几章小说用自然语言描述你想预测什么——然后等着看一群 AI 在你的沙盘里开派对。⚙️ 技术原理为什么一千个 AI 角色比一个 AI 准普通 LLM 预测是单线程的你问一个问题它给你一个答案。但社会现象不是一个人能算出来的——从众效应、信息级联、少数派观点发酵这些东西只有群体互动才会出现。MiroFish 的核心设计是基于智能体的社会模拟Agent-Based Social Simulation, ABSS五步走种子材料新闻/报告/小说图谱构建实体抽取关系识别人设生成千人千面角色创建平行模拟OASIS引擎驱动对话报告生成ReportAgent分析结果深度交互与任意角色/报告对话第一步图谱构建。系统把种子材料喂给 LLM提取出关键实体人物、组织、事件和关系存入 Zep Cloud 的图数据库。同时为群体注入初始集体记忆——相当于给每个智能体一个共同的知识基线。第二步人设生成。这是最精彩的部分。系统不是创建 1000 个一模一样的 AI而是根据种子材料自动推断这个世界里可能有哪些类型的人。比如在一个舆情推演场景中它会生成激进派大学生“谨慎的校方领导”“吃瓜群众”专业媒体人等不同角色每个有不同的立场、知识面和表达风格。第三步平行模拟。OASIS 框架接管——一个专为社交媒体模拟设计的引擎管理着成千上万智能体之间的对话交互。智能体会根据自己的人设和记忆选择跟谁聊“聊什么”。关键的涌现机制在这里当一个有影响力的智能体说完其他人会根据社会关系网络做出反应——转述、质疑、赞同、歪曲——信息在传播中变形共识在争议中形成。第四步报告生成。模拟结束后一个专门的 ReportAgent 带着丰富的工具集进入模拟后的世界对所有的对话记录、关系网络、情绪时间线做分析生成结构化预测报告。 LLM API Zep Cloud️ OASIS引擎⚙️ 后端️ 前端 用户 LLM API Zep Cloud️ OASIS引擎⚙️ 后端️ 前端 用户loop[每轮交互]上传材料预测需求POST /api/graph/build实体抽取关系识别结构化图谱数据存储图谱初始记忆启动模拟(智能体数量/轮数)智能体决策(跟谁聊/说什么)回复内容更新记忆模拟完成(全部对话记录)ReportAgent生成报告结构化预测报告报告交互接口与任意智能体对话/追问第五步深度交互。这是 MiroFish 区别于普通输入-输出式 AI 工具的地方。你可以点击模拟世界中的任意一个角色跟 Ta 单独对话也可以跟 ReportAgent 继续追问。你不是在看一份报告——你是在探索一个平行宇宙。️ 架构分析MiroFish 的代码结构相当清晰前后端分离核心服务模块化MiroFish/ ├── frontend/ # React Vite 前端 ├── backend/ │ ├── app/ │ │ ├── api/ # Flask 路由层 │ │ │ ├── graph.py # 图谱构建 API │ │ │ ├── simulation.py # 模拟控制 API │ │ │ └── report.py # 报告 API │ │ ├── services/ # 核心业务逻辑 │ │ │ ├── graph_builder.py # 实体提取图谱构建 │ │ │ ├── ontology_generator.py # 人设生成 │ │ │ ├── oasis_profile_generator.py # 转化为OASIS配置 │ │ │ ├── simulation_runner.py # 模拟编排 │ │ │ ├── report_agent.py # 报告生成智能体 │ │ │ └── zep_* # Zep记忆/图谱服务 │ │ └── models/ # 数据模型 │ └── pyproject.toml └── docker-compose.yml设计亮点OASIS 作为模拟引擎——MiroFish 没有重新发明轮子而是站在 CAMEL-AI 团队的肩膀上。OASIS 专门为社交媒体模拟设计已经处理好了智能体管理、时间推进、关系网络等底层问题。MiroFish 团队把精力集中在上游的种子材料处理和下游的报告生成上这是聪明的工程技术选择。Zep Cloud 的记忆分层——不是简单的向量数据库Zep 提供的是用户记忆 知识图谱 时序记忆的三层架构。在模拟中智能体的短期对话记忆和长期人格记忆被分别存储这让智能体既能记住刚才聊了什么又不会丢掉自己是什么人。双平台模拟——从 API 设计来看模拟支持双平台并行意味着你可以在不同的参数配置下同时跑两场模拟然后对比结果——这对做假设检验“如果主流媒体介入会怎样”非常有用。不够好的地方Token 消耗没有内置的预估和控制机制新手很容易跑完一场模拟才发现烧了几十块钱模拟过程中的状态可视化还比较弱前端只展示结果过程中发生了什么完全黑盒中文智能体的对话质量有时会崩——角色的人设会飘移比如谨慎的领导突然变得像营销号小编这和底层 LLM 的指令遵循能力有关✅ 优缺点 适用场景三个优点真·涌现效应——不是让 LLM 直接回答预测问题而是让智能体互动产生涌现结果这在底层方法论上是对的上手快——两个 API Key 一行安装命令就能跑没有复杂的自建服务依赖案例真实可靠——武汉大学舆情和红楼梦推演都有完整的 B 站演示视频不是 PPT 项目两个缺点成本不透明——没有 Token 预估没有费用提示模拟花费全靠跑完才知道对种子材料敏感——输入质量直接影响输出质量没有内置的材料质量评估谁应该立刻试试在做舆情分析、政策研究、市场调研的团队小说作者/内容创作者想推演自己的世界观对多智能体模拟技术感兴趣的研究者谁应该再等等只想要一句话预测的用户——MiroFish 太重了ChatGPT 就够了预算敏感的开发者——OASIS Zep LLM 三块费用叠加个人使用成本不低需要高精度金融预测的场景——群体智能在金融预测上的方法论还不够成熟MiroFish 让我看到多智能体模拟正在从学术走向工程化。它不是又一个 LLM 套壳而是用让 AI 互相对话的方式回答那些单靠预测模型无法回答的问题。如果能解决成本控制和过程可视化的问题这条路大有可为。