CLI-Anything 是一个由香港大学数据科学团队(HKUDS)开发的开源项目,旨在弥合人工智能代理(AI Agents)与现实世界专业软件之间的巨大鸿沟。其核心理念是“今天的软件服务于人类,明天的用户将是智能体”。该项目通过自动化的方式,将任何拥有源代码的软件(如 GIMP、Blender、LibreOffice 等)转化为具备结构化命令行接口(CLI)的工具,使 AI 代理能够无需图形界面(GUI)自动化或专用 API 即可直接控制这些软件。
CLI-Anything开源项目官网入口网址:https://github.com/HKUDS/CLI-Anything
CLI-Anything开源项目官网中文文档:链接

核心痛点与解决方案
当前,AI 代理虽然具备强大的推理能力,但在操作实际专业软件时面临巨大挑战。传统的解决方案通常依赖于脆弱的 UI 自动化(如截图点击)、有限的官方 API,或是功能被大幅削减的重新实现。CLI-Anything 提出了一种颠覆性的解决方案:它不替换软件,而是为软件生成一个“代理原生”的命令行外壳(Harness)。这个外壳直接调用真实的软件后端进行渲染和处理,保留了软件 100% 的专业功能,同时提供了适合 LLM(大语言模型)理解的标准化文本命令和 JSON 输出格式。
工作原理:全自动七阶段流水线
CLI-Anything 的核心是一个高度自动化的七阶段生成流水线,可通过 Claude Code 插件、OpenCode 命令或 Codex Skill 触发:
- 分析(Analyze):扫描源代码,将 GUI 动作映射到内部 API。
- 设计(Design):架构命令组、状态模型及输出格式。
- 实现(Implement):构建基于 Click 框架的 CLI,包含 REPL(交互式命令行)、JSON 输出及撤销/重做功能。
- 测试计划(Plan Tests):制定单元测试和端到端测试计划。
- 编写测试(Write Tests):实施全面的测试套件。
- 文档(Document):更新测试结果文档。
- 发布(Publish):生成安装脚本并将 CLI 部署到系统路径。
此外,项目还支持“细化(Refine)”功能,通过差距分析不断扩展 CLI 的功能覆盖率。
技术优势与特点
- 真实集成:生成的 CLI 直接调用真实应用(如 Blender 渲染场景、LibreOffice 生成 PDF),拒绝“玩具级”实现。
- 结构化交互:所有命令均支持 –json 标志,输出机器可读的结构化数据,极大降低了 Agent 解析结果的难度。
- 通用性与轻量级:CLI 是跨平台的通用接口,无需复杂依赖,且利用 –help 标志实现自我描述,便于 Agent 自主发现功能。
- 生产级质量:项目已在 11 款复杂软件(涵盖图像编辑、3D 建模、办公套件、视频剪辑等领域)上成功验证,累计通过 1508 项测试(包括单元测试和真实软件调用的端到端测试),通过率达 100%。
应用场景
CLI-Anything 适用于广泛的领域,包括创意设计(GIMP, Blender)、数据分析(Jupyter, Superset)、开发工具(Jenkins, Portainer)、企业办公(LibreOffice, NextCloud)以及科学计算等。无论是开源项目还是私有代码库,只要提供源码,CLI-Anything 都能将其转化为 Agent 可操控的强大工具。
CLI-Anything 不仅是一个工具生成器,更是一套方法论(HARNESS.md),它定义了如何将人类设计的软件无缝转化为适应 AI 时代的“Agent 原生”基础设施,极大地释放了智能体在复杂工作流中的潜力。





