新智元报道

编辑:LRST

【新智元导读】北京邮电大学团队开源的MASFactory框架,用Vibe Graphing重构多智能体系统编排。它将自然语言指令转化为结构化工作流,三步完成角色分配、拓扑设计与语义补全,API成本降为传统方式的十分之一,代码量暴减,开发效率飙升。系统以图为核心,支持混合编排与全栈可视化,已通过多项权威测试,性能全面超越同类方案。

外网爆火,比Vibe Coding便宜10倍!北邮重构多智能体编排范式

近日,YouTube等外网平台上一段名为《Vibe Graphing: 10x More Affordable than Vibe Coding (MAS-Factory)》的技术解析视频在开发者圈层中引发了强烈的共鸣与热议。


视频中给出的数据令人咋舌:在同等任务复杂度下,传统的Vibe Coding试错成本高达数美元,而采用一种名为「Vibe Graphing」的全新范式,API成本直接骤降至原来的十分之一,且成功率大幅跃升。

这支视频背后的主角,正是由北京邮电大学团队最新开源的LLM多智能体编排框架——MASFactory


项目官网: https://masfactory.dev

代码仓库: https://github.com/BUPT-GAMMA/MASFactory

原版论文: https://arxiv.org/abs/2603.06007

目前,该项目已在GitHub全面开源,学术论文也已同步发布。

Vibe Coding在多智能体编排水土不服

伴随着基础大模型能力的溢出,业界形成了一个明确的技术共识:通过角色特化、交叉验证和迭代协作,多智能体系统(MAS)能够解决单一 Agent 难以覆盖的长周期复杂任务。

然而,构建一个健壮、可扩展的 MAS,依然是一场令人筋疲力尽的工程「泥沼战」。

现有的编排框架主要分为两个派别:

即使是当下备受瞩目的Vibe Coding范式,也难以弥补上述两种开发范式的缺陷。

由于大多数大语言模型在训练时缺乏对各类小众DSL(特定领域语言)的充分学习,当Vibe Coding工具面对硬编码框架时往往显得水土不服。

这不仅意味着开发者需要付出额外的Token成本来让模型预习DSL语法,还投入大量精力,去约束AI遵循DSL的拓扑规范与通信逻辑,导致开发体验大打折扣。对于可视化拖拽派,Vibe Coding工具更是难以入手。

Vibe Graphing

多智能体编排的一等公民

Vibe Graphing工具本质上是一个「自然语言意图 -> 结构化中间表示(IR) -> 可执行工作流」的编译器。

与Vibe Coding简单粗暴地让AI直接吐出底层代码不同,Vibe Graphing将MAS的构建抽象为一个极具秩序感的三阶段设计过程。在引擎内部,这被封装为由三个Agent驱动的Loop组件:


阶段一:角色分配(Role Assignment)

系统首先剥离所有的代码实现细节,只关注「人」。当开发者输入诸如「帮我构造一个文献综述工作流」的自然语言指令时,引擎会将任务意图映射为一组候选智能体(如检索员、阅读员、写作员、评审员),并划定严格的责任边界。

阶段二:拓扑设计(Topology Design)

确定角色后,系统开始构建一张有向图拓扑骨架。这个骨架只定义节点间的消息依赖和执行顺序(如串行、并行、循环),而不涉及任何具体的 Prompt 或工具调用。

阶段三:语义补全(Semantic Completion)

最后,系统对拓扑骨架进行参数化实例化,为每个节点精准配置指令、输入输出约束。

因为AI每次只需要生成或修改极其简短的JSON拓扑配置,而不是几千行的 Python 逻辑代码,Token消耗呈指数级下降;从而达到了比Vibe Coding节省10倍token的效果。

MASFactory

以图为中心的四层架构

Vibe Graphing 能够如此优雅地运行,是因为 MASFactory 拥有一个底层图引擎,它将多智能体工作流建模为有向计算图。整个系统被科学地划分为四个层次:


图骨架

在最底层,系统完全由 Node(节点)和 Edge(边)构成。MASFactory 极其硬核地对协作信号进行了物理隔离,拆分为三种流:


组件层与可复用层

基础的节点被进一步抽象为丰富的组件库。除了遵循感知-推理-行动(Perception-Reasoning-Action)范式的基础Agent外,系统还提供了:


协议与上下文适配层

现代MAS应用不可避免地需要整合异构的外部组件(Memory、RAG、MCP等)。

MASFactory引入了两种适配器:


混合编排与可视化交互层

在操作入口上,MASFactory 同时兼容代码开发(声明式、命令式)、可视化拖拽以及 Vibe Graphing。

值得注意的是,这三种方式不仅不冲突,反而可以在同一个大型项目中混合嵌套使用。你可以用代码硬编码一个底层极度严谨的工具子图,再用 Vibe Graphing 生成一个静态结构图,最后用可视化拖拽方式将他们组合在为一个完整的Workflow。

此外,MASFactory也提供一款深度集成的 VS Code 扩展工具——MASFactory Visualizer。它可以在代码编排阶段、拖拽式编排阶段、Vibe Graphing阶段、调试运行阶段提供全栈的可视化支持。


代码编排预览


拖拽式工作流设计


Vibe Graphing 交互


运行时监测与追踪

性能评估

MASFactory在 HumanEval、MBPP、BigCodeBench、SRDD、GAIA、MMLU-Pro 等七大覆盖代码生成与复杂推理的主流 Benchmark 上给出了具有说服力的数据。

实验表明,MASFactory 能够极为稳定且高效地复现当前业界最具代表性的系统(包括 ChatDev、MetaGPT、Agent Verse、CAMEL、HuggingGPT 等),且在多项指标上表现优于原始硬编码实现。


参考资料:

https://arxiv.org/abs/2603.06007

https://github.com/BUPT-GAMMA/MASFactory