skip to content
Yowakko Jay
Table of Contents
封面图

前言

在AI辅助开发领域,如何让多个智能体高效协作一直是一个核心挑战。最近我探索了一套基于 Golutra + OpenClaw + Feishu 的自动化AI工作流系统,并进行了为期一周的实战测试。本文将分享这套系统的设计理念、测试成果以及未来的改进方向。

一、系统搭建与设计理念

1.1 设计动机

在实际开发中,我们常常面临两个核心痛点:

  • 协作复杂性高:不同Agent来自异构平台,API接口规范不一,通信协作需大量人工干预,难以形成端到端的高效闭环
  • 人工调度成本高昂:开发者需在多工具间频繁切换,手动分配任务、传递上下文,效率低下且易出错

1.2 我的目标

构建自动化AI工作流,打造「Golutra + OpenClaw + Feishu」统一协作平台,实现智能体间的无缝协同

1.3 系统架构:三位一体的智能协作模式

系统架构图

整个系统由三个核心组件构成:

Golutra - 核心执行引擎

模拟微型开发团队,包含三种Agent:

  • 监工(Supervisor):负责任务分解
  • 助理(Assistant):负责环境准备
  • 成员(Member):负责代码编写

通过这种分层设计,实现全流程自动化执行。

OpenClaw - 沟通桥梁/用户秘书

作为中间件,OpenClaw承担以下职责:

  • 接收飞书自然语言指令
  • 进行意图识别与格式化处理
  • 精准传递任务给核心引擎

Feishu - 用户交互界面

用户与系统交互的主入口,通过熟悉的聊天界面实现对AI工作流的低门槛操控。

1.4 工作流程

系统的工作流程如下:

任务执行实时日志(OpenClaw Web UI + Cloudflare Tunnel 反向代理)

1. 用户发起指令 (飞书)
↓ 输入自然语言指令,如"为UnifiedQuantum项目添加量子傅里叶变换函数并提交PR"
2. OpenClaw 解析与转发
↓ 精准识别用户核心意图,将自然语言指令封装为标准化的任务请求格式
3. Golutra 任务分解与调度
↓ 监工Agent将复杂主任务拆解为:克隆代码、分析结构、生成代码等原子子任务
4. 跨CLI 通信执行 (golutra-mcp)
↓ 作为通信中枢,在成员Agent与Claude Code等工具之间高效传递上下文与代码
5. 结果汇总与反馈
↓ 监工Agent汇总所有子任务结果,通过OpenClaw向用户发送任务完成通知

二、项目测试与成果展示

2.1 实战测试成果

经过一周的持续测试,系统在以下两个真实开源项目中验证了其有效性:

提交高质量 Pull Request

提交PR截图

针对 UnifiedQuantum 核心项目,工作流成功完成了:

  • 生成功能完整的模块代码
  • 提交结构清晰、包含单元测试的PR
  • 完全满足开源社区的协作规范与代码质量要求

有效提交 Issue 分析报告

提交Issue截图

针对 quantum-computing-skill 项目,工作流自动:

  • 检测到潜在的性能瓶颈问题
  • 独立完成了成因分析
  • 提交了包含复现步骤、日志信息与优化建议的详细Issue报告

2.2 用户体验优化

实时状态反馈

在任务执行过程中,用户可通过飞书实时收到进度更新,例如:

  • “已完成代码生成”
  • “正在运行测试”
  • “PR已提交”

完整任务报告

工作流执行结束后自动生成详细的任务完成报告,包含:

  • 任务分解逻辑
  • 自动化执行的具体步骤序列
  • 最终的产出结果

实现工作的可视化与可追溯。

2.3 详细任务总览

系统为每个任务生成完整的执行记录:

quantum-computing-skill 任务总览

quantum-computing-skill任务总览
  • 详细列出了任务的分解逻辑、具体执行步骤和最终交付结果
  • 完整记录了每一步的操作轨迹与关键数据表现
  • 实现了任务的可视化复盘

UnifiedQuantum 任务总览

UnifiedQuantum任务总览
  • 全面展示了项目的整体执行情况
  • 重点涵盖核心Bug的修复细节与GitHub代码贡献记录
  • 直观体现了团队的协作效率与代码交付质量

三、资源消耗分析

3.1 测试环境配置

配置项参数
核心模型MiniMax-m2.7-high speed
测试周期连续5个工作日 (Mon-Fri)
模拟任务负载大约5个中等复杂度开发任务

3.2 实测资源消耗表现

经过五天的持续测试:

7-8% 周限额消耗占比(3019/45000)

结论:max套餐一个人基本上只要不是24h持续高负载开发,基本用不完。

四、问题总结与后续计划

4.1 当前存在的核心问题

尽管系统已经能够完成基本的自动化工作流,但仍存在以下问题:

  1. 重复工作导致效率浪费

    • 处理相似任务时,频繁重复执行环境准备等基础步骤
    • 缺乏复用机制,严重拖慢整体流程
  2. 调度策略缺乏灵活性

    • 目前基于固定的线性顺序执行任务
    • 未能根据实时状态和任务复杂度实现动态的智能调度与路径规划
  3. 缺失自动化评估反馈

    • 对生成的代码质量、任务完成度及逻辑合理性
    • 缺乏一套完善的自动化评估标准和闭环反馈机制
  4. Agent 记忆腐蚀

    • 在多轮交互和长任务中,Agent的上下文逐渐退化
    • 早期关键信息被遗忘或弱化

4.2 未来改进方向

针对上述问题,我计划从以下几个方向进行优化:

改进方向说明
Harness Engineering引入验证与约束机制,提高结果可靠性
Self-Reflection深度集成代码静态分析工具,建立基于测试覆盖率与结果的多维质量评估模型,实现产出物自动打分
Memory Engineering解决长期上下文退化问题,支持跨Agent共享记忆
Planning & Scheduling优化任务拆分与调度策略,减少重复执行

结语

这套「Golutra + OpenClaw + Feishu」自动化AI工作流系统,虽然还有很大的优化空间,但已经在实际项目中证明了其可行性。随着后续对调度策略、评估反馈和记忆管理等方面的持续优化,相信能够进一步提升开发效率,释放更多生产力。

如果你对这套系统感兴趣,欢迎与我交流讨论!

评论