MiroFish实测：多智能体宏观与行业趋势推演 | 国联民生金工_基金资讯

MiroFish实测：多智能体宏观与行业趋势推演 | 国联民生金工

创始人

2026-03-24 22:52:55

0次

来源：市场资讯

（来源：尔乐量化）

- 报告摘要 -

SUMMARY

➤ MiroFish是一个开源的群体智能预测引擎，通过构建高保真平行数字世界实现宏观与行业趋势推演。

其技术架构深度融合时序GraphRAG、多智能体系统与OASIS仿真引擎，能够基于用户上传的“种子材料”自动生成具备独立人格、长期记忆与行为逻辑的AI智能体，在虚拟社交平台中并行演化并涌现群体行为模式。不同于传统统计回归工具，MiroFish核心创新在于将知识图谱中的实体转化为数字孪生Agent，通过双轨仿真环境推演复杂决策场景，最终生成包含事件脉络、风险预警与策略建议的结构化预测报告。

➤ 黄金2026年走势预测案例展示了从“种子文件”到群体涌现的完整工作流与核心发现。

基于涵盖八项材料的“种子文件”，系统构建了包含政府部门、金融机构、专家等60个Agent的仿真社会，经72轮跨平台互动推演，形成黄金2026年走势的模型输出结果。该流程验证了图谱构建、人设初始化、双轨仿真到报告生成的自动化能力，但也暴露出封闭环境的局限——当输入信息存在偏差时，Agent会持续强化错误认知，仅能通过后续对话补充事实信息进行有限修正。

➤ 在能力测评中，MiroFish展现出优秀的知识图谱构建与多维度叙事能力，但在预测精确性上未显著超越联网LLM。

在黄金走势预测案例中，模型虽然逻辑深度更高，但从投资建议实用性维度未显著超越Kimi K2.5联网下的回答。基础能力测试显示，得益于Zep Cloud的时序关系记忆服务，系统在Agent人格设计、端到端流程自动化及多元视角模拟方面表现突出；金融任务测评涵盖AI产业政策、大类资产配置、地缘冲突推演与科技路径预测四大场景，证明其在政策影响分析、产业链传导路径研判等需要反复推敲的宏观研究领域具有独特价值；基模型对比发现，Claude Opus 4.6在因果推演、结构化分析方面表现更优，而Qwen 3.5-plus在数据密度与结论具象化上更具优势。

➤ MiroFish或更适合作为逻辑推演与查漏补缺的“沙盒”工具，而非高精度预测终端。

由于其封闭模拟环境极度依赖“种子文件”的准确性与完整性，系统容易放大部分假设偏误，且受限于Token成本难以实现大规模深度交互。实际应用中，MiroFish的价值主要体现在提供强叙事性与逻辑闭环的分析框架，辅助研究人员进行政策影响推演、技术路线排查及假设情景测试，但对于需要实时数据验证或精确数值预测的投资决策，建议结合传统量化模型与联网AI工具交叉验证。

MiroFish是什么

CHAPTER

当下随着AI Agent能力的指数级提升，智能体技术正从单一任务执行向复杂系统协作演进，成为推动AI向生产力主体跃迁的关键工程。多Agent协同成为重要的探索方向。从简单的对话助手到如今自主决策的数字化参与者，Agent技术正在重塑各行各业的工作范式，尤其在需要处理非结构化信息、模拟复杂决策场景的领域中展现出独特价值。未来我们将开启系列报告，系统探索AI Agent技术在量化金融投研领域的创新应用与工程实践。本报告我们将首先探索多智能体项目：MiroFish。

MiroFish是一个开源AI预测引擎，定位为“简洁通用的群体智能引擎”。项目发布于2025年12月，于2026年3月登顶GitHub全球趋势榜榜首。与传统基于统计回归的预测工具不同，MiroFish的核心创新在于通过构建高保真平行数字世界来推演未来。系统能够从用户上传的“种子材料”（如突发新闻、政策草案、金融信号、文学文本或数据分析报告）中提取关键信息，自动生大量具备独立人格、长期记忆与行为逻辑的AI智能体。这些智能体在虚拟环境中自由交互、社会演化，通过群体涌现效应生成预测结果。

1.1MiroFish机制简介

MiroFish的技术架构深度融合了时序GraphRAG（图检索增强生成）技术、多智能体系统（Multi-Agent System, MAS）以及OASIS仿真引擎。系统支持严肃的商业决策预演（如政策评估、金融投资推演、舆情危机模拟）与创意仿真。

MiroFish采用“数字孪生社会”架构，其核心不是单一AI模型，而是一个多智能体并行计算集群：

1、由用户输入“种子材料”和模拟提示词

2、由图谱构建引擎生成GraphRAG知识网络

3、由智能体工厂生成N个独立人格智能体

4、双轨仿真环境推演

5、由涌现检测器捕捉群体行为模式生成结构化预测报告

图谱构建过程中，LLM根据输入的“种子材料”自动分析文档，提取实体类型（Entity Types）与关系类型（Edge Types），并构建对应知识图谱，同时为每个实体节点注入个体记忆（个人经历）与群体记忆（社会背景），形成可演化的数字社会基础架构。其核心依赖的时序知识图谱与长期记忆服务，由 Zep Cloud提供。Zep Cloud 是一个为AI Agent设计的长期记忆服务，区别于传统向量数据库，它专门优化了时序关系记忆，使AI能够像人类一样记住“谁在什么时间做了什么”，并随时间更新关系。

环境搭建过程中，MiroFish将知识图谱中的Person节点转化为具备完整人格的Agent，Organization节点转化为“大发言人”拟人化实体。每个Agent配置包含：年龄、性别、MBTI、职业、国籍、活动频率、情感倾向、立场（支持/反对/中立）、影响力权重，同时包含基于“种子材料”生成的认知背景。MiroFish还将配置Agent自动生成OASIS仿真规则（互动频率、话题敏感度、平台特性参数）。

仿真执行过程中，MiroFish启动模拟的X与Reddit两个社交平台并行仿真，通过zep_graph_memory_updater.py，Agent行为实时转化为自然语言描述回写至Zep图谱，实现关系动态更新（如信任度衰减、立场转变）。

报告生成过程中，MiroFish采用ReACT（Reasoning & Acting）范式，主动调用工具集而非被动生成文本。工具集构成包括：

1）insight_forge：深度洞察提取；

2）panorama_search：跨平台全景检索

3）interview_agents：智能体访谈（查询决策动机）报告生成将整合Twitter+Reddit双平台数据，识别舆论极化、级联传播、相变临界点、意见领袖涌现等复杂网络特征。最终输出结构化Markdown报告，包含事件脉络、关键时间节点、风险预警、策略建议等模块。

1.2MiroFish工作流程

我们通过模拟黄金2026年走势分析的案例来探索MiroFish的工作流程。MiroFish开启后会要求用户传入现实“种子文件”和模拟提示词。

“种子材料”作为模拟的设定信息起到条件约束和框架设定的作用。我们通过Claude Opus4.6模型生成一个描述黄金市场现状和核心影响因素的“种子文件”，以及对应的模拟提示词。“种子文件”包含7209字，涵盖了黄金的八项材料总结，包括黄金的驱动框架、历史表现特点、2026年关键事件、机构观点等因素。模拟提示词则给出需要讨论的议题和需要预测的问题。

开始模拟后，模型会首先根据材料生成实体与实体间关系。实体部分包含了政府部门、金融专家、金融机构、军事组织、国际组织、关键人物等，实体间关系包含了工作关系、汇报关系、公开支持/反对关系、监管关系、合作关系、行动关系等。

然后模型会结合上下文，自动调用工具从知识图谱梳理实体与关系，初始化模拟个体Agent，并基于现实种子赋予他们独特的行为与记忆。案例中模型生成了60个Agent人设，包括其基本信息、人设简介、关联话题、人设背景等，其中基本信息的设置为随机生成与现实和“种子文件”未必相符。

Agent生成好后模型将利用其进行信息广场（X）和话题社区（Reddit）的互动模拟。案例中Agent进行了72轮的互动，包括发表观点，喜欢/不喜欢某观点，回复观点，关注点赞等。

最终通过工具的调用，模型将生成最终的预测报告。报告的模型输出核心结论：虽然2026年一季度的金价飙升在表象上与1979年的地缘驱动如出一辙，但其见顶后的演化路径将截然不同。在债务高企、美联储受制以及全球去美元化加速的宏观底色下，黄金已完成从“抗通胀工具”向“主权信用对冲工具”的蜕变。其后续走势将以宽幅震荡代替深幅回调，在新的信用定价体系中寻找更高的历史中枢。

生成报告后MiroFish还提供与报告或者其中的个体Agent进行对话以及发送问卷调查的功能。在与报告Agent的对话中可以进行深度归因、全景跟踪、快速检索、虚拟访谈。在与个体Agent对话中可以深度了解不同立场个体的驱动因素和对问题的看法。

MiroFish的一大约束在于其极度依赖“种子文件”的信息。如果“种子文件”有事实错误，其会不断放大错误的影响，同时如果有“种子文件”缺失的信息，其也无法通过现实搜索进行信息的证实和补充。总体来说模型为封闭环境模拟。比如案例中我们指出事实与其预测的误差，其更倾向于坚持“种子文件”信息推导出的观点。

但通过在与报告Agent对话中补充现实世界信息，其可以依据信息重新推断。案例中我们补充了更多的事实信息后，模型可以进行修正后的进一步推断。虽然最终其对黄金的长期观点不变，但也给出了短期事实与预测背离的原因解释。

同时报告Agent还可以对未来假设进行分析推演。我们在案例中追问如若美联储采取沃尔克式加息应对通胀下的情景推演。其分析整体逻辑清晰详实，可以作为逻辑链条补充和查漏工具。

同样的“种子文件”和问题我们调用了Kimi K2.5进行了回答，并用ChatGPT进行评价与打分。从结果来看MiroFish的报告并未显著优于联网LLM的直接回答。整体来看MiroFish的报告强在叙事性——在历史对比深度、政策分析深度、宏观研究深度上更强，但由于其封闭的演化环境导致其容易放大部分假设，并且更为谨慎给出明确的判断，而联网LLM更愿意直接给出判断。

MiroFish能力测评

CHAPTER

2.1基础能力测评

我们使用Claude Code对MiroFish进行测评实验，在基础能力测评中主要设计了5个实验，其运行结果总结如下：

总体来说MiroFish的知识图谱、Agent设计较为优秀，这部分主要来源于Zep Cloud的贡献。除此之外模型整体端到端流程自动化也较好，预测报告信息量丰富，多元视角模拟有效。

2.2金融任务测评

为了验证 MiroFish 在投资决策相关场景中的预测价值，我们通过Claude Code设计了包括产业政策分析、资产配置预测、地缘冲突推演和科技路径预测这四项实验。

场景1：产业政策 — AI产业促进条例

知识图谱从“种子材料”中提取了34个实体节点和29条关系边，生成14个 Agent（含政府机构、券商、科技企业、学者、中小企业等角色）。92个交互行为中，Agent围绕政策受益方、落地执行争议、中小企业困境等多维度展开讨论。报告对产业链传导路径和资金流向做出了具体预判。

场景2：资产预测 — 2026Q2大类资产配置

图谱提取48个节点、50条边，涵盖全球主要金融机构、分析师和宏观经济实体。84个交互行为反映了多空双方的激烈博弈。报告对各类资产的相对强弱、主要风险因子和配置策略方向做出了系统性分析。

场景3：地缘推演 — 美以对伊军事冲突

这是所有投资场景中Agent行为最活跃的（124个action），充分体现了地缘议题引发的多方博弈特性。报告涵盖冲突烈度情景分析、原油价格冲击路径、避险资产反应、大国外交立场演变等核心关注点。报告长度也最大，分析深度最高。

场景4：科技路径 — 从LLM到具身智能

耗时最长，Agent行为数最多（164个），说明技术路线争论引发了最为广泛的讨论互动。报告对技术拐点判断、产业链价值重分配和泡沫风险识别等问题提供了多角度分析。

2.3基模型效果测评

在MiroFish的基模型选择中，我们尝试了Qwen 3.5-plus和Claude Opus 4.6两个模型，对上述4个场景做了相同的测验，并用独立的Claude Code评估了模型效果。测试结果如下：

从基本指标来看：Claude在全部4个场景中均显著快于Qwen；在图谱构建中，Qwen倾向于构建更大、更密的知识图谱，而Claude图谱更精简。

从报告质量指标来看：Qwen强在数据密度、投资可操作性、结论具象化，而Claude强在因果推演能力、结构化分析、信息诚实度、语言一致性。

总结与思考

CHAPTER

MiroFish作为群体智能引擎已经实现了AI群体交互涌现的基本架构。其生成的智能体层次丰富多元，架构清晰合理，但交互次数和深度由于token成本约束较难做到大规模模拟下的效果，且Agent细节现阶段无法达到“数字孪生”水平的精细度，整体适用于对精确度要求并不那么高的模拟预测。

从生成报告的质量来说，MiroFish并未显著好于联网LLM，但叙事性更强。MiroFish的封闭模拟环境使得其对“种子文件”中的偏误信息容易持续放大影响，对“种子文件”准确性和完整性有着较高要求，但MiroFish通过大规模Agent模拟可以达到较强的叙事性，逻辑闭环更强，比较适合对于分析逻辑的启发、查漏、推演。

在金融任务中，我们认为MiroFish依然有其自身的优势。MiroFish较强的叙事性和逻辑闭环较为适用于宏观研究中的政策影响分析、资产驱动分析等需要反复推敲的研究，也适用于产业趋势研究中对于技术路线、价值链中各种可能性的详细排查，其内置的报告与Agent对话机制可支持多情景推演，为用户在不同假设条件下开展“沙盒”测试提供了灵活的工具支持。

风险提示

CHAPTER

1）模型存在信息封闭性与推演偏差风险。MiroFish采用封闭环境模拟，无法自主检索外部信息验证“种子文件”准确性，若输入材料存在事实错误或信息缺口，Agent交互可能持续放大偏差形成“逻辑自洽但事实错误”的群体幻觉；同时智能体涌现行为具有随机性，可能产生情绪化或非理性一致性偏差。

2）文中AI生成的分析与结论不代表我司任何观点和投资建议。文中场景推演结果和模型测评结果由AI模型生成，仅供测试参考，任何情况下不代表国联民生证券的观点和意见；或有AI生成内容错误等风险；任何情况下，AI输出结果均不构成投资建议。

重要提示

《证券期货投资者适当性管理办法》于2017年7月1日起正式实施，通过本微信订阅号/本账号发布的观点和信息仅供民生证券的专业投资者参考，完整的投资观点应以国联民生证券股份有限公司（下称“国联民生证券”）发布的完整报告为准。若您并非国联民生证券客户中的专业投资者，为控制投资风险，请取消订阅、接收或使用本订阅号/本账号中的任何信息。本订阅号/本账号难以设置访问权限，若给您造成不便，敬请谅解。国联民生证券不会因为关注、收到或阅读本订阅号/本账号推送内容而视相关人员为客户；市场有风险，投资需谨慎。

免责声明

国联民生证券股份有限公司（下称“国联民生证券”）已获中国证监会许可的证券投资咨询业务资格，本平台推送观点和信息仅供国联民生证券研究服务客户参考，完整的投资观点应以国联民生证券研究所发布的完整报告为准。若您非国联民生证券研究服务客户，为控制投资风险，请勿订阅、接受、转载或使用本平台中的任何信息，若给您造成不便，敬请谅解。国联民生证券不会因订阅本平台的行为或者收到、阅读本平台推送内容而视相关人员为客户。任何未经国联民生证券同意或授权而对本平台内容进行复制、转发或其他类似不当行为均被严格禁止。对于使用本平台包含信息所引起的后果，国联民生证券概不承担任何责任。

本平台及国联民生证券研究报告所载资料的来源及观点的出处皆被国联民生证券认为可靠，但国联民生证券不对其可靠性、准确性、时效性或完整性做出任何保证。本平台推送内容仅反映国联民生证券研究人员于发出完整报告当日的判断，本平台所载的资料、意见及推测有可能因发布日后的各种因素变化而不再准确或失效，国联民生证券不承担更新不准确或过时的资料、意见及推测的义务，在对相关信息进行更新时亦不会另行通知。在任何情况下，本平台所载信息、意见不构成对任何人的投资建议，所述证券或金融工具买卖的出价或征价，评级、目标价、估值、盈利预测等分析判断亦不构成对具体证券或金融工具在具体价位、具体时点、具体市场表现的投资建议。本平台所包含的观点及建议并未考虑获取本平台包含信息的机构及个人的具体投资目的、财务状况、特殊状况、目标或需要，客户应当充分考虑自身特定状况，进行独立评估，并应同时考量自身的投资目的、财务状况和特定需求，必要时就法律、商业、财务、税收等方面咨询专家的意见，不应单纯依靠本报告所载的内容而取代自身的独立判断。在法律允许的情况下，国联民生证券及其关联方可能持有本平台推送内容中提及的公司所发行证券的头寸并进行交易，也可能为这些公司提供或正在争取提供投资银行、财务顾问、咨询服务等相关服务。客户应充分考虑可能存在的利益冲突，勿将本平台推送内容作为投资决策的唯一参考依据。对任何直接或间接使用本平台所载信息和内容或者据此进行投资所造成的任何一切后果或损失，国联民生证券及/或其关联人员均不承担任何形式的法律责任。

法律声明

本微信号及其推送内容的版权归国联民生证券所有，国联民生证券对本微信号及其推送内容保留一切法律权利。未经国联民生证券事先书面许可，任何机构或个人不得以任何形式转载、翻版、复制、刊登、发表、修改、仿制或引用本订阅号中的内容。任何订阅人如引用或转载本平台所载内容，务必注明出处为国联民生证券研究所，且转载应保持完整性，不得对内容进行有悖原意的引用和删改。转载者需严格依据法律法规使用该文章，转载者单方非法违规行为与我司无关，由此给我司造成的损失，我司保留法律追究权利。

上一篇：中证红利ETF招商（515080）逆势上扬，机构：建议逢低布局红利资产，中长期行情仍具支撑

下一篇：中国人民银行行长潘功胜会见蒙古国中央银行行长那仁朝格特

MiroFish实测：多智能体宏观与行业趋势推演 | 国联民生金工

相关内容

热门资讯