ZeroClaw 产品需求文档(PRD)
版本:0.1.6 | 日期:2026-02-23
产品愿景
让每个人都能拥有一个安全、高效、可控的 AI 智能体,无论是在云服务器上,还是在一块 10 美元的开发板上。
ZeroClaw 要解决的核心问题是:现有的 AI Agent 框架(如基于 Python 的 LangChain)太重了——动辄占用 1GB 内存、启动慢、部署复杂、安全性靠开发者自觉。而 ZeroClaw 用 Rust 从零构建,追求的是:
- 8.8MB 二进制,树莓派也能跑
- 开箱即用的安全防护,不用自己操心
- 想接什么模型接什么模型,想连什么平台连什么平台
- 配置一个文件搞定,改一行就能切换
目标用户
用户画像 1:独立开发者 / 技术爱好者
"我想搞一个自己的 AI 助手,能在 Telegram 上跟我聊天,帮我管理服务器,但不想花时间折腾 Python 环境和一堆依赖。"
- 需要简单部署(一个二进制文件 + 一个配置文件)
- 需要多平台接入(Telegram、Discord 等)
- 对性能有追求,不想让 Agent 吃掉服务器的内存
- 想自己控制 Agent 能做什么不能做什么
用户画像 2:企业技术团队
"我们需要一个内部 AI 助手平台,要安全、可审计、能部署在私有云,最好能接入飞书/钉钉/企业微信。"
- 需要企业级安全(沙箱、白名单、密钥加密、审计日志)
- 需要接入国内平台(飞书、钉钉、QQ、智谱 GLM)
- 需要可观测性(Prometheus/OTEL)
- 需要 PostgreSQL 后端支持团队共享记忆
用户画像 3:硬件/嵌入式开发者
"我想让 AI 控制我的树莓派和 STM32 开发板,做一个智能家居控制中心。"
- 需要极致的二进制大小和内存占用
- 需要硬件外设支持(GPIO、串口、传感器)
- 需要在 ARM/RISC-V 架构上运行
- 需要离线运行能力(Ollama 本地模型)
用户画像 4:开源贡献者
"我想给这个项目贡献代码,加一个新的模型提供者或者聊天平台。"
- 需要清晰的扩展接口(trait 定义明确)
- 需要完善的文档和开发指南
- 需要 CI/CD 保障贡献质量
- 需要合理的代码组织和命名规范
核心功能清单
P0 — 核心功能(已实现)
多模型支持
| 功能 |
状态 |
说明 |
| OpenAI (GPT-4/4o) |
✅ |
原生函数调用、视觉、流式 |
| Anthropic (Claude) |
✅ |
原生工具、视觉、推理内容 |
| Google Gemini |
✅ |
原生函数声明、视觉 |
| OpenRouter |
✅ |
200+ 模型路由 |
| AWS Bedrock |
✅ |
托管部署 |
| GitHub Copilot |
✅ |
OAuth 认证 |
| Ollama(本地) |
✅ |
离线运行 |
| 智谱 GLM |
✅ |
中文大模型 |
| 自定义兼容接口 |
✅ |
支持任意 OpenAI/Anthropic 兼容 API |
| 弹性包装器 |
✅ |
自动重试、超时、降级 |
| 模型路由 |
✅ |
按任务类型路由到不同模型 |
多频道支持
| 频道 |
状态 |
特色 |
| Telegram |
✅ |
轮询/Webhook,附件处理 |
| Discord |
✅ |
意图系统,服务器/频道过滤 |
| Slack |
✅ |
Bolt 兼容 |
| WhatsApp |
✅ |
Cloud API + Web QR 双模式 |
| Matrix |
✅ |
端到端加密 |
| 飞书/Lark |
✅ |
Webhook + WebSocket |
| Email |
✅ |
SMTP/IMAP 异步 |
| iMessage |
✅ |
macOS 原生 |
| Signal |
✅ |
Signal Desktop API |
| Mattermost |
✅ |
自托管企业IM |
| IRC |
✅ |
RFC 1459 |
| 钉钉 |
✅ |
阿里巴巴生态 |
| QQ |
✅ |
腾讯生态 |
| Nostr |
✅ |
去中心化协议 |
| NextCloud Talk |
✅ |
自托管 |
| CLI |
✅ |
命令行交互 |
| Webhook |
✅ |
通用 HTTP |
Agent 能力
| 功能 |
状态 |
说明 |
| 多轮对话 |
✅ |
自动历史管理和压缩 |
| 工具调用 |
✅ |
原生 + 提示引导两种模式 |
| 流式输出 |
✅ |
实时草稿更新 |
| 自动记忆 |
✅ |
对话自动保存和召回 |
| 混合搜索 |
✅ |
关键字 + 向量加权混合 |
| 文件操作 |
✅ |
读/写/编辑,路径安全校验 |
| Shell 命令 |
✅ |
白名单控制 |
| 浏览器 |
✅ |
WebDriver 自动化 |
| HTTP 请求 |
✅ |
网络调用 |
| 定时任务 |
✅ |
Cron 表达式 + 一次性 + 固定间隔 |
| 子 Agent 委派 |
✅ |
将任务分配给子 Agent |
| 图片理解 |
✅ |
多模态视觉 |
| PDF 阅读 |
✅ |
文档解析 |
安全
| 功能 |
状态 |
说明 |
| 配对认证 |
✅ |
6 位一次性码,类似蓝牙配对 |
| 频道白名单 |
✅ |
默认拒绝所有 |
| 文件系统隔离 |
✅ |
workspace_only + 黑名单 |
| 命令白名单 |
✅ |
只允许指定命令 |
| 沙箱 |
✅ |
Landlock/Bubblewrap/Firejail |
| 密钥加密 |
✅ |
ChaCha20-Poly1305 |
| 凭据脱敏 |
✅ |
日志和输出自动脱敏 |
| 速率限制 |
✅ |
可配置 |
| 紧急停止 |
✅ |
E-Stop 一键停止 |
| Webhook 签名 |
✅ |
HMAC-SHA256 校验 |
P1 — 重要功能(已实现)
| 功能 |
状态 |
说明 |
| 硬件外设 |
✅ |
STM32、树莓派、ESP32、Arduino |
| 身份/人格系统 |
✅ |
Markdown 或 JSON 格式定义 Agent 身份 |
| 技能系统 |
✅ |
TOML 清单管理可用技能 |
| Composio 集成 |
✅ |
1000+ OAuth 应用 |
| 可观测性 |
✅ |
Log + Prometheus + OTEL |
| 热重载 |
✅ |
修改配置不重启生效 |
| 数据迁移 |
✅ |
从 OpenClaw 迁移 |
| 健康检查 |
✅ |
所有子系统健康监控 |
| 心跳 |
✅ |
保活和状态上报 |
| Shell 补全 |
✅ |
Bash/Zsh/Fish/PowerShell/Elvish |
P2 — 增强功能(已实现或部分实现)
| 功能 |
状态 |
说明 |
| Docker 运行时 |
✅ |
沙箱化执行环境 |
| 推送通知 |
✅ |
Pushover |
| Web3 消息 |
✅ |
Nostr + Linq |
| 语音转文字 |
✅ |
Transcription 频道 |
| 多语言文档 |
✅ |
英/中/日/俄/法/越 |
| 一键部署 |
✅ |
bootstrap.sh 脚本 |
非功能性需求
| 指标 |
目标 |
当前 |
| 二进制大小 |
< 15MB |
~8.8MB ✅ |
| 基础内存 |
< 10MB |
< 5MB ✅ |
| 启动时间 |
< 1s |
< 100ms ✅ |
| 最低硬件 |
$10 SBC |
树莓派 Zero ✅ |
安全
| 指标 |
要求 |
| 默认安全 |
所有权限默认关闭,需明确授权 |
| 密钥管理 |
加密存储,运行时不落盘明文 |
| 网络暴露 |
默认仅本地绑定 |
| 审计 |
所有敏感操作可追踪 |
可用性
| 指标 |
要求 |
| 部署 |
单二进制 + 单配置文件即可运行 |
| 配置 |
TOML 格式,人类可读 |
| 错误提示 |
明确的错误信息和修复建议 |
| 文档 |
6 种语言,覆盖所有功能 |
可扩展性
| 指标 |
要求 |
| 新 Provider |
实现 trait + 注册工厂 |
| 新 Channel |
实现 trait + 注册工厂 |
| 新 Tool |
实现 trait + 注册工厂 |
| 新硬件 |
实现 Peripheral trait |
| Feature Flag |
可选编译,不增加基础包体积 |
可维护性
| 指标 |
要求 |
| 代码规范 |
Rust 标准命名(snake_case/PascalCase) |
| CI/CD |
格式检查 + Clippy + 测试 + 审计 |
| PR 流程 |
模板化、标签化、自动化 |
| 测试 |
集成测试 15+,单元测试 100+ |
竞品对比
vs 重型框架(LangChain/LlamaIndex/AutoGen)
| 维度 |
ZeroClaw |
LangChain 等 |
| 语言 |
Rust |
Python |
| 二进制大小 |
8.8MB |
N/A(需要 Python 运行时 + 依赖) |
| 内存占用 |
< 5MB |
数百 MB ~ 1GB+ |
| 部署 |
单二进制 |
Python 环境 + pip 依赖 |
| 安全 |
内置多层防护 |
需自行实现 |
| 硬件支持 |
原生嵌入式 |
不支持 |
| 频道集成 |
25 个内置 |
需额外库 |
| 类型安全 |
编译期保证 |
运行时报错 |
ZeroClaw 的优势:性能、安全、部署简单、硬件支持
LangChain 的优势:生态更大、上手门槛低(Python)、社区更活跃
vs 轻量框架(OpenClaw/CrewAI)
| 维度 |
ZeroClaw |
OpenClaw |
| 语言 |
Rust |
Go |
| 内存占用 |
< 5MB |
~1GB+ |
| 安全模型 |
9 层纵深防御 |
基础级 |
| 频道数量 |
25 |
~10 |
| Provider 数量 |
11 |
~5 |
| 硬件支持 |
✅ |
❌ |
| 记忆系统 |
混合搜索 |
基础存取 |
| 可观测性 |
Log + Prometheus + OTEL |
基础日志 |
| 维度 |
ZeroClaw |
Dify/Coze |
| 部署 |
自托管 / 边缘 |
云托管为主 |
| 数据主权 |
完全自控 |
平台托管 |
| 定制性 |
代码级无限定制 |
GUI 拖拽,上限明确 |
| 成本 |
仅 API 费用 |
平台费 + API 费 |
| 硬件 |
支持嵌入式 |
不支持 |
| 离线 |
Ollama 支持 |
不支持 |
使用场景
场景 1:个人 Telegram AI 助手
部署:树莓派 4 / 轻量 VPS
模型:OpenAI GPT-4o 或 Ollama 本地模型
频道:Telegram
工具:Shell + 文件操作 + HTTP 请求
安全:workspace_only + 命令白名单
用户通过 Telegram 跟 Agent 聊天,让它帮忙查信息、管理文件、执行脚本。成本:仅 API 调用费。
场景 2:企业内部知识助手
部署:Kubernetes / Docker
模型:Azure OpenAI 或 AWS Bedrock
频道:飞书 + 钉钉 + Slack
记忆:PostgreSQL(团队共享)
安全:沙箱 + 白名单 + OTEL 审计
员工通过企业 IM 提问,Agent 从知识库中检索答案,记住团队上下文。
场景 3:智能家居控制中心
部署:树莓派 Zero
模型:Ollama(本地 7B 模型)
频道:CLI + Telegram
硬件:GPIO 控制灯光/传感器
安全:workspace_only + 最小权限
"帮我把客厅灯打开" → Agent 调用 GPIO 工具 → 点亮 LED。
场景 4:DevOps 运维助手
部署:运维服务器
模型:Claude / GPT-4
频道:Slack + Webhook
工具:Shell + Git + HTTP + 定时任务
安全:命令白名单 + 文件系统隔离
接收告警 Webhook → Agent 自动诊断 → 执行修复脚本 → 在 Slack 报告。
场景 5:多平台内容管理
部署:VPS
模型:OpenRouter(按任务选模型)
频道:Discord + Telegram + Email
工具:浏览器 + HTTP + 文件
记忆:SQLite 混合搜索
统一管理多个社区平台的消息、自动回复、内容整理。
CLI 命令体系
ZeroClaw 提供了完整的命令行工具:
| 命令 |
说明 |
zeroclaw onboard |
交互式初始化向导 |
zeroclaw agent |
启动 Agent(单次或持续运行) |
zeroclaw gateway |
启动 HTTP 网关 |
zeroclaw daemon |
守护进程模式 |
zeroclaw service |
系统服务管理 |
zeroclaw doctor |
诊断检查 |
zeroclaw status |
查看运行状态 |
zeroclaw estop |
紧急停止 |
zeroclaw cron |
定时任务管理 |
zeroclaw models |
模型管理 |
zeroclaw providers |
列出可用 Provider |
zeroclaw channel |
频道管理 |
zeroclaw integrations |
集成管理 |
zeroclaw skills |
技能管理 |
zeroclaw migrate |
数据迁移 |
zeroclaw auth |
认证管理 |
zeroclaw hardware |
硬件设备管理 |
zeroclaw peripheral |
外设管理 |
zeroclaw memory |
记忆管理 |
zeroclaw config |
配置管理(含 JSON Schema 导出) |
zeroclaw completions |
生成 Shell 补全脚本 |
风险与限制
技术风险
| 风险 |
影响 |
缓解措施 |
| Rust 学习曲线高 |
社区贡献门槛较高 |
完善文档、提供模板、代码注释 |
| 编译时间长 |
开发迭代慢 |
增量编译、feature flag 减少编译范围 |
| 异步 Rust 复杂 |
新手容易踩坑 |
统一使用 tokio,避免混用运行时 |
产品风险
| 风险 |
影响 |
缓解措施 |
| 模型 API 依赖 |
服务中断影响可用性 |
Reliable 包装器自动重试和降级 |
| 安全漏洞 |
Agent 被滥用 |
多层防护、安全审计、E-Stop |
| 平台 API 变更 |
Channel 实现失效 |
解耦设计,快速修复单个实现 |
| 25 个频道维护负担 |
部分频道可能滞后 |
Feature flag 隔离,社区共同维护 |
已知限制
| 限制 |
说明 |
| 无 GUI |
纯命令行 + 配置文件,没有 Web 管理界面 |
| 无内置 RAG |
有混合搜索,但不是完整的 RAG 管线 |
| 单节点 |
不支持分布式 Agent 集群 |
| 无多租户 |
一个实例服务一个 Agent 身份 |
版本路线图(推断)
基于代码成熟度和文档中的线索:
v0.2.x — 稳定化
- 完善所有频道的测试覆盖
- 配置迁移和向后兼容
- 性能基准测试自动化
- 安全审计和渗透测试
v0.3.x — 增强
- 更完善的 RAG 管线(文档加载、分块、索引)
- WebUI 管理面板(可选)
- 多 Agent 协作
- 插件市场
v1.0 — 生产就绪
- API 稳定性承诺
- 语义化版本控制
- 企业支持选项
- 完整的安全合规文档
成功指标
| 指标 |
目标 |
| GitHub Stars |
持续增长 |
| 活跃贡献者 |
50+ |
| 生产部署数 |
可量化的用户案例 |
| 平均问题关闭时间 |
< 7 天 |
| 二进制大小 |
始终 < 15MB |
| 测试覆盖率 |
> 70% |
| 文档完整性 |
所有功能都有文档 |