当 AI Agent 需要操作桌面软件:Flue 开源桥接方案让编码助手操控 Photoshop 和 Blender
用 Claude Code、Cursor 或 Codex 写代码已经够酷了——但如果你的 AI 编码助手不只写代码,还能直接操作 Photoshop 修图、在 Blender 里建模、或者帮你在 Excel 里整理数据呢?
这就是 Flue 解决的问题。2026 年 5 月初在 GitHub 上开源的 Flue(目前已有 25+ Stars),定位是一个”极简桥接”工具,让 AI 编码 Agent 可以直接调用桌面软件的脚本 API,完全不需要配置 MCP 服务器或依赖截图分析。
Flue 的核心哲学
Flue 的思路很直观:桌面软件(Photoshop、Blender、Unity 等)本身就内置了脚本自动化能力——Photoshop 有 ExtendScript,Blender 有 Python API,Adobe 套件有 COM/AppleScript 接口。Flue 充当一个桥梁,把 Agent 的指令翻译成应用自身的脚本语言,然后执行并返回 JSON 结果。
Agent Shell → flue 命令 → 应用脚本运行时 → JSON 结果
对比 MCP(Model Context Protocol)方案,Flue 的优势在于零配置——不需要注册 tool schema、不需要启动 server 进程、不需要维护复杂的 transport 层。大部分桌面软件早已有完整的脚本文档,Flue 只是把这个层暴露给 AI Agent。
安装与使用
Flue 的安装简单到令人发指:
pip install flue flue setup
安装后,flue setup 会自动检测你当前配置的 AI 编码 Agent(Claude Code、Codex、Cursor、Gemini CLI、OpenCode、Cline 等十几种),并将 Flue 注册为可用的工具。之后你的 Agent 就知道它可以调用 Flue 去操作桌面软件了。
支持的软件生态
Flue 目前支持的桌面软件覆盖了创意工具、办公套件和游戏引擎三大领域:
- Adobe 全家桶:Photoshop、Illustrator、InDesign、Premiere Pro、After Effects、Audition
- 3D 与建模:Blender、Autodesk 3ds Max、SideFX Houdini
- 游戏引擎:Unity
- 办公软件:Microsoft Word、Excel、PowerPoint
实战场景一:用 Agent 批量处理 Photoshop 图片
假设你正在用 Claude Code 重构一个电商网站的前端,同时需要把 200 张商品图统一调整为 1920×1080 并应用相同的色彩校正。传统流程:手动打开 Photoshop → 录制动作 → 批量处理——至少 20 分钟。用 Flue,Agent 可以直接调 Photoshop 的 API 完成:
# Agent 自动调用 Flue 操作 Photoshop
flue photoshop run-script 'batch_process("input_folder", "output_folder", {
"width": 1920, "height": 1080,
"color_adjust": {"levels": [0, 255, 1.5], "saturation": 10}
})'
Agent 解析你的需求后,自动生成 ExtendScript 脚本,Photoshop 执行后返回 JSON 结果。整个过程不需要你离开终端。
实战场景二:Agent 控制 Blender 自动建模
如果你在做 AI 生成 3D 内容的管道,Flue 同样能派上用场。比如让 Agent 操作 Blender 自动生成场景:
# Agent 调用 Blender 的 Python API flue blender run-script ' import bpy bpy.ops.mesh.primitive_cube_add(size=2, location=(0, 0, 0)) bpy.ops.material.new() # 应用材质和渲染设置 '
这对游戏开发团队特别有用——CI 管道中可以使用 Flue + Agent 自动完成资源生成和导出,避免了”开发→导出→检查”的手动循环。
实战场景三:Excel 数据处理自动化
Flue 对手头没有安装任何特殊工具的非技术用户也很有用——Agent 可以直接操作你电脑上的 Excel:
flue excel run-script 'Workbooks.Open("report.xlsx").Worksheets(1).Range("A1:D100").Sort(Key1:=Range("D1"), Order1:=xlDescending)'
Agent 可以帮你完成数据清洗、报表生成、格式统一等重复性工作,就像有个虚拟助手在操作你的 Office。
与 MCP 和 Computer Use 的对比
AI Agent 控制桌面软件目前主要有三条路线:
| 方案 | 原理 | 优点 | 缺点 |
|---|---|---|---|
| MCP | 定义 Schema + 协议传输 | 标准化、可扩展 | 配置复杂、维护成本高 |
| Computer Use | 截图+VLM 理解 | 通用性强 | 速度慢、不稳定、成本高 |
| Flue | 直接调用应用 API | 零配置、速度快、结果精确 | 需要应用本身支持脚本化 |
Flue 走的是”应用原生集成”路线——不是模拟人类操作,而是直接调用软件的内部 API。这比截图分析方案可靠得多,也比 MCP 方案轻量得多。
使用建议
- 先确认软件支持:Flue 依赖应用内置的脚本运行环境,首次使用前确保目标软件已安装并启用了脚本支持
- 监督 Agent 操作:初期建议让 Agent 先生成脚本预览,确认无误后再执行——毕竟一键删图层可不是闹着玩的
- 配合 Shell 隔离:由于 Flue 通过 CLI 桥接,建议在隔离的 Agent 会话中操作,避免影响正在编辑的文档
总结
Flue 代表了一种务实的思路——与其为 AI Agent 构建复杂的操控层,不如直接利用桌面软件已存在的脚本接口。对于频繁使用 Adobe 套件、Blender 或 Office 的开发者来说,Flue 是一个值得加入工具箱的开源项目。