%%{init:{'theme':'base','themeVariables':{'primaryColor':'#FDEAEA','primaryBorderColor':'#D9382E','lineColor':'#D9382E','primaryTextColor':'#1A2332'}}}%%
graph LR
A[2011 做PDF公司] --> B["2021 以$1亿+卖掉"]
B --> C[创始人低谷期]
C --> D[2025.4 AI点燃热情]
D --> E[43个项目试错]
E --> F["2025.11 第44个=OpenClaw"]
F --> G[2026.1 爆发]
G --> H[2026.2 加入OpenAI]
| 维度 | ChatGPT / Claude | OpenClaw |
|---|---|---|
| 本质 | AI 大模型 | 编排层,用大模型作大脑 |
| 交互 | 浏览器 / App | 飞书、Telegram、WhatsApp… |
| 在线 | 关窗口就没了 | 7×24 不关机 |
| 能力 | 对话框说话 | + 跑命令 + 发邮件 + 操作文件 |
| 记忆 | 对话结束即忘 | 文件持久保存 |
| 主动性 | 你问它才答 | 定时检查,主动汇报 |
| 数据 | 在它们服务器 | 在你自己机器上 |
| 费用 | $20+/月订阅 | 软件免费,付 API 费 |
| 定制 | 一个文本框 | 整个文件系统 + git(代码版本管理工具)版本控制 |
%%{init:{'theme':'base','themeVariables':{'primaryColor':'#E8F0FC','primaryBorderColor':'#1D5EC8','lineColor':'#1D5EC8','primaryTextColor':'#1A2332'}}}%%
graph LR
A[AGENTS.md] --> B[SOUL.md]
B --> C[USER.md]
C --> D[今天/昨天日记]
D --> E[MEMORY.md]
E --> F[准备就绪]
| 文件 | 作用 | 关注度 |
|---|---|---|
| AGENTS.md | 操作规则(所有会话) | ✅ 核心 |
| SOUL.md | AI 性格(主会话) | ✅ 核心 |
| USER.md | 用户画像(主会话) | ✅ 核心 |
| MEMORY.md | 永久记忆(主私聊) | ✅ 核心 |
| IDENTITY.md | 防注入锚点 | 进阶 |
| TOOLS.md | 工具使用规则 | 进阶 |
| HEARTBEAT.md | 定时检查清单 | 进阶 |
| BOOT.md | 重启时执行 | 进阶 |
| SHIELD.md | 安全策略 | 进阶 |
| memory/*.md | 每日日志(自动写) | 自动 |
| skills/*.md | 技能定义 | 按需 |
%%{init:{'theme':'base','themeVariables':{'primaryColor':'#E8F0FC','primaryBorderColor':'#1D5EC8','lineColor':'#1D5EC8','primaryTextColor':'#1A2332'}}}%%
graph LR
A[你在手机打字] --> B[飞书传给OpenClaw]
B --> C[Gateway路由]
C --> D[加载四文件+Skills]
D --> E[AI大脑决策]
E --> F[执行工具]
F --> G[整理答案]
G --> H[手机弹通知]
%%{init:{'theme':'base','fontSize':18,'themeVariables':{'primaryColor':'#E8F0FC','primaryBorderColor':'#1D5EC8','lineColor':'#1D5EC8','primaryTextColor':'#1A2332'}}}%%
graph LR
A[接到任务] --> B[思考拆解]
B --> C[选择工具]
C --> D[执行操作]
D --> E[检查结果]
E -->|还没完成| B
E -->|完成了| F[最终回复]
%%{init:{'theme':'base','fontSize':18,'themeVariables':{'primaryColor':'#E8F0FC','primaryBorderColor':'#1D5EC8','lineColor':'#1D5EC8','primaryTextColor':'#1A2332'}}}%%
graph LR
A[对话进行中] --> B[上下文快满了]
B --> C[触发 memoryFlush(记忆刷写)]
C --> D[AI 把重要信息写入文件]
D --> E[清理上下文]
E --> F[继续工作]
%%{init:{'theme':'base','themeVariables':{'primaryColor':'#E6F5EC','primaryBorderColor':'#128A3E','lineColor':'#128A3E','primaryTextColor':'#1A2332'}}}%%
graph LR
A["Heartbeat定时7:00"] --> B[搜索Skill搜新闻]
B --> C[AI整理5条摘要]
C --> D[参考MEMORY.md个性化]
D --> E[发到飞书]
%%{init:{'theme':'base','themeVariables':{'primaryColor':'#E6F5EC','primaryBorderColor':'#128A3E','lineColor':'#128A3E','primaryTextColor':'#1A2332'}}}%%
graph LR
A[录音发给AI] --> B[语音转文字]
B --> C[提取结论+Action Items]
C --> D[按参会人分配]
D --> E[发到对应群]
%%{init:{'theme':'base','themeVariables':{'primaryColor':'#E6F5EC','primaryBorderColor':'#128A3E','lineColor':'#128A3E','primaryTextColor':'#1A2332'}}}%%
graph LR
A[写完文章] --> B[发给AI]
B --> C[自动套模板排版]
C --> D[粘贴到公众号发布]
%%{init:{'theme':'base','themeVariables':{'primaryColor':'#E6F5EC','primaryBorderColor':'#128A3E','lineColor':'#128A3E','primaryTextColor':'#1A2332'}}}%%
graph LR
A[接到任务] --> B[发现没能力]
B --> C[自己写Skill]
C --> D[自己安装]
D --> E[自己完成任务]
%%{init:{'theme':'base','themeVariables':{'primaryColor':'#F0E8FC','primaryBorderColor':'#6B2DC7','lineColor':'#6B2DC7','primaryTextColor':'#1A2332'}}}%%
graph LR
A["AGENTS.md
铁律·不可改"] --> B["SOUL.md
性格·可成长"]
B --> C["USER.md
画像·你更新"]
C --> D["MEMORY.md
笔记·AI记录"]
| 没训练的 AI | 训练过的 AI | |
|---|---|---|
| 风格 | 万能模板 | 知道你喜欢三段式 |
| 称呼 | "尊敬的客户" | 直接称呼客户名 |
| 语气 | 客套话连篇 | 用你的口吻 |
| 效率 | 你还得改半天 | 记得上次进度,接着聊 |
| 安全 | 不经同意就发 | AGENTS.md 规定必须确认 |
| 项目 | 费用 | 说明 |
|---|---|---|
| OpenClaw 软件 | $0 | MIT 开源 |
| 运行机器 | $0-15/月 | 自己电脑免费 |
| AI 模型 API | $1-200+/月 | 主要开支,完全可控 |
| 模型 | 月费范围 | 适合谁 |
|---|---|---|
| Claude Haiku | $10-30 | 日常简单任务 |
| Claude Sonnet | $30-70 | 新手推荐,性价比最高 |
| Claude Opus | $150-750 | 需要强推理的复杂任务 |
| DeepSeek / 国产模型 | $5-15 | 预算有限 |
| 本地模型(Ollama) | $0 | 需要好 GPU(显卡) |
%%{init:{'theme':'base','themeVariables':{'primaryColor':'#F0E8FC','primaryBorderColor':'#6B2DC7','lineColor':'#6B2DC7','primaryTextColor':'#1A2332'}}}%%
graph LR
A["第1-3天
安装+连平台"] --> B["第1周
写四文件+安全"]
B --> C["第2-4周
装Skill+定时任务"]
C --> D["第2月+
进阶自动化"]
sk-sp-,无问芯穹 = sk-cp-,MiniMax = MINIMAX-// 注释行。大多数平台的 Coding Plan Base URL 包含 /coding/ 路径,与通用 API 地址不同,不可混用。
| 模型 | 适用场景 | 备注 |
|---|---|---|
qwen3-coder-plus | 日常编码 | 代码专用 |
qwen3.5-plus | 复杂推理 | 最新旗舰通用模型 |
qwen3-coder-next | 高难度编码 | 代码增强版 |
kimi-k2.5 | 长上下文 | 256K 上下文 |
glm-5 | 中文理解 | 智谱最新旗舰 |
| 模型 | 适用场景 | 备注 |
|---|---|---|
ark-code-latest | 通用 | Auto 调度入口,开启后自动匹配模型 |
doubao-seed-2.0-code | 编码 | 豆包代码模型 |
doubao-seed-2.0-pro | 通用 | 豆包通用模型 |
doubao-seed-2.0-lite | 简单任务 | 轻量版,省额度 |
deepseek-v3.2 | 复杂推理 | DeepSeek 最新 |
kimi-k2.5 | 长上下文 | 256K 上下文 |
MiniMax-M2.5 | 通用 | MiniMax 旗舰 |
glm-4.7 | 中文理解 | 智谱代码模型 |
| 模型 | 适用场景 | 备注 |
|---|---|---|
tc-code-latest | 通用 | Auto 模式,自动匹配模型 |
hunyuan-turbos | 通用编码 | 腾讯混元,响应快 |
hunyuan-2.0-instruct | 指令跟随 | 混元 2.0 指令模型 |
hunyuan-2.0-thinking | 深度推理 | 混元思维模型 |
hunyuan-t1 | 复杂任务 | 混元最新旗舰 |
glm-5 | 中文理解 | 智谱旗舰 |
kimi-k2.5 | 长上下文 | 256K 上下文 |
MiniMax-M2.5 | 通用 | MiniMax 旗舰 |
| 模型 | 适用场景 | 备注 |
|---|---|---|
glm-4.7 | 日常编码 | Lite 即可 |
glm-4.6 | 日常编码 | Lite 可用 |
glm-5 | 复杂任务 | 旗舰,高峰期 3 倍额度消耗 |
glm-4.5 | 简单任务 | 省额度 |
glm-4.5-air | 轻量任务 | 省额度 |
api.minimaxi.com,海外用 api.minimax.io,Key 与域名需匹配。| 模型 | 适用场景 | 备注 |
|---|---|---|
MiniMax-M2.5 | 通用编码 | 旗舰模型 |
MiniMax-M2.5-highspeed | 快速迭代 | 需 Highspeed 专属套餐(98 元/月+) |
MiniMax-M2.1 | 通用 | 上一代旗舰 |
MiniMax-M2 | 简单任务 | 省额度 |
/coding/ 路径,使用标准 API 端点,区别仅在 API Key。
| 模型 | 适用场景 | 备注 |
|---|---|---|
deepseek-v3.2 | 复杂推理 | DeepSeek 最新版本 |
deepseek-v3.2-thinking | 深度分析 | 带思维链,适合难题 |
kimi-2.5 | 长上下文 | 注意:无 "k" 前缀 |
glm-5 | 中文理解 | 智谱旗舰 |
glm-4.7 | 日常编码 | 性价比高 |
MiniMax-M2.5 | 通用 | MiniMax 旗舰 |
MiniMax-M2.1 | 通用 | MiniMax 上一代 |
| 模型 | 百炼 | 火山 | 腾讯 | 百度 | 华为 | 联通 | 智谱 | MiniMax | Kimi | Infini | 摩尔 | 快手 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Qwen3.5 | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | 🟢 | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ |
| Qwen3.5-Plus | 🟢 | ⚪ | ⚪ | ⚪ | ⚪ | 🟢 | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ |
| Qwen3-Max | 🟢 | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ |
| Qwen3-Coder-Next | 🟢 | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ |
| Qwen3-Coder-Plus | 🟢 | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ |
| Doubao-Seed-2.0-Code | ⚪ | 🟢 | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ |
| Doubao-Seed-2.0-Pro | ⚪ | 🟢 | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ |
| Doubao-Seed-2.0-Lite | ⚪ | 🟢 | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ |
| DeepSeek-V3.2 | ⚪ | 🟢 | ⚪ | 🟢 | 🟢 | ⚪ | ⚪ | ⚪ | ⚪ | 🟢 | ⚪ | ⚪ |
| DeepSeek-V3.2-Thinking | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | 🟢 | ⚪ | ⚪ |
| DeepSeek-V3.1 | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | 🟢 | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ |
| GLM-5 | 🟢 | ⚪ | 🟢 | 🟢 | 🟢 | 🟢 | 🟢 | ⚪ | ⚪ | 🟢 | ⚪ | ⚪ |
| GLM-4.7 | 🟢 | 🟢 | ⚪ | 🟢 | ⚪ | ⚪ | 🟢 | ⚪ | ⚪ | 🟢 | 🟢 | ⚪ |
| GLM-4.6 | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | 🟢 | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ |
| GLM-4.5/Air | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | 🟢 | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ |
| Kimi-K2.5 | 🟢 | 🟢 | 🟢 | ⚪ | ⚪ | 🟢 | ⚪ | ⚪ | 🟢 | 🟢 | ⚪ | ⚪ |
| Kimi-K2-Thinking | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | 🟢 | ⚪ | ⚪ | ⚪ |
| MiniMax M2.5 | 🟢 | 🟢 | 🟢 | ⚪ | ⚪ | 🟢 | ⚪ | 🟢 | ⚪ | 🟢 | ⚪ | ⚪ |
| MiniMax M2.5-HS | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | 🟢 | ⚪ | ⚪ | ⚪ | ⚪ |
| MiniMax M2.1 | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | 🟢 | ⚪ | 🟢 | ⚪ | ⚪ |
| MiniMax M2 | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | 🟢 | ⚪ | ⚪ | ⚪ | ⚪ |
| Hunyuan 系列 | ⚪ | ⚪ | 🟢 | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ |
| KAT-Coder-Pro V1 | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | ⚪ | 🟢 |
/coding/ 路径,MiniMax 除外),不是通用 API 地址!用错地址 = 不走套餐额度 = 额外扣费/:如 https://xxx.com/coding/v3 而非 https://xxx.com/coding/v3/sk-sp-,无问芯穹 sk-cp-,MiniMax MINIMAX-),不可混用curl -H "Authorization: Bearer yourKey" yourBaseURL/modelsfallbacks 备用模型(见上方)contextTokens: 50000 控制上下文大小,减少不必要的 API 调用/compact 压缩会话
@larksuite/openclaw-lark-tools),能力大幅提升。之前我们还特地写了一个让机器人创建完文档之后把文档权限给我们的流程——因为之前机器人创建的文档我们只有阅读权限,没有编辑权限——现在这个问题也解决了。sudo 重新执行。
openclaw -v 查看已安装的 OpenClaw 版本。新版插件对 OpenClaw 的版本要求如下,若低于该版本,插件运行可能出现异常:
npm install -g openclaw 升级sudo 重新执行。~/.openclaw/openclaw.json:openclaw doctor --generate-gateway-tokenbind: "loopback" 限本机;auth.mode: "token" 要求密钥。OPENCLAW_GATEWAY_TOKEN 或 OPENCLAW_GATEWAY_PASSWORDexec.security: "deny";fs.workspaceOnly: true;elevated: false。{ enabled: false } 禁用提权network: "none" 防数据外泄;readOnlyRoot: true 防篡改;capDrop: ["ALL"] 防提权;user: "1000:1000" 非 root。openclaw secrets audit --check~/.openclaw/ —— 主配置目录,仅 owner 可访问openclaw.json —— 主配置文件,含 Gateway tokensecrets.json —— SecretRef 凭据文件SKILL.md 文件。Agent 在对话开始时读取它,就像员工上班前先看工作手册。没有代码执行,没有二进制,只有提示词。
| 维度 | Skills | Tools (MCP) |
|---|---|---|
| 本质 | 提示词 + 元数据 | 可执行函数/API |
| 存在形式 | SKILL.md 文本文件 | 运行中的服务进程 |
| 安装方式 | clawhub install 或手动放文件 | 配置 MCP Server 地址 |
| 谁写 | 任何人(只需写 Markdown) | 开发者(需写代码) |
| 运行时角色 | 注入系统提示词,指导 Agent 行为 | 提供可调用的函数接口 |
| 类比 | 📖 使用说明书 / SOP | 🔨 锤子 / 螺丝刀 |
.openclaw/skills/ 目录下,只对当前项目生效。适合项目专属的编码规范、部署流程~/.openclaw/skills/ 目录下,对所有项目生效。适合个人通用习惯,如 Git 工作流、代码风格requires 字段可以声明前置条件:requires.bins:需要哪些 CLI 工具(如 docker, git)——没装就跳过requires.env:需要哪些环境变量(如 API Key)——没配就跳过requires.os:限定操作系统(darwin / linux / win32)| 字段 | 必填 | 说明 |
|---|---|---|
| name | ✅ | Skill 唯一标识,小写 + 连字符(如 weather-check) |
| description | ✅ | ⚡ 最关键字段!Agent 根据它决定是否触发。写得太保守 = 永远不会被调用 |
| version | 否 | 语义化版本号(semver),ClawHub 发布时必填 |
| tags | 否 | 分类标签,帮助 ClawHub 搜索和推荐 |
| requires.bins | 否 | 依赖的 CLI 工具列表,缺失则 Skill 不加载 |
| requires.env | 否 | 依赖的环境变量列表,缺失则 Skill 不加载 |
| requires.os | 否 | 限定操作系统(darwin / linux / win32) |
| metadata.openclaw | 否 | OpenClaw 特定配置,如 min_version、always: true |
clawhub install user/skill@1.2.0references/ 文件夹,放入参考文档、示例代码等。SKILL.md 中可以引用这些文件。scripts/ 文件夹,放入辅助脚本。Agent 可以在 Skill 指导下执行这些脚本。dependencies,安装时自动拉取依赖的其他 Skill。openclaw skills list --eligible 确认已加载 ② 检查 description 是否足够宽泛 ③ 检查 requires 门控是否通过。90% 的问题出在 description 太窄。
description: "Check weather: current and forecast"。不加引号 YAML 会把冒号后的内容当成嵌套 key。
~/.openclaw/logs/skill-name.log 追加一条记录",让 Agent 自己记。社区也有 skill-analytics 技能可用。
metadata.openclaw.always: true 后,Skill 每次对话都会加载(不需要 description 匹配)。注意:会占用上下文窗口,建议只对核心 Skill 使用(如安全审计、代码规范),否则会拖慢响应。
| 技能 | 作用 | 为什么需要 | 链接 |
|---|---|---|---|
| anthropic-frontend-design | Anthropic 官方设计系统,反"AI slop"美学(277K 下载,第一名) | 前端开发质量飞跃,避免千篇一律的 SaaS 风格 | GitHub |
| GitHub | GitHub 全套操作:issues/PRs/CI(10K 下载) | 开发者日常刚需,steipete 出品 | GitHub |
| coding-agent | 运行 Codex/Claude Code/OpenCode 等编程助手 | 多 agent 协同编程,steipete 出品 | GitHub |
| arcane-docker-manager | Docker 容器/compose/网络/卷/镜像管理 + 系统监控 | 开发/部署必备,比 docker-essentials 更全面 | GitHub |
| 技能 | 作用 | 为什么需要 | 链接 |
|---|---|---|---|
| agent-browser | Rust 高速无头浏览器自动化 CLI(11K 下载) | 网页自动化核心,支持导航/点击/输入/截图/录屏/Cookie/多标签/语义定位 | GitHub |
| GOG | Google Workspace 全家桶:Gmail/Calendar/Drive/Sheets/Docs(14K 下载) | 办公自动化一站式方案,steipete 出品 | GitHub |
| gws | Google 官方 Workspace CLI,动态发现所有 API | 比 GOG 更全面,Google 官方出品,含 100+ agent skills + 50 workflow recipes | GitHub |
| Clawflows | 多步骤工作流编排 | 串联多个技能为自动化管线 | clawhub install clawflows |
| n8n | 跨平台自动化集成(连接 n8n 实例) | 连接各种 SaaS 工具,触发复杂工作流 | GitHub |
| 技能 | 作用 | 为什么需要 | 链接 |
|---|---|---|---|
| Mission Control | AI Agent 编排仪表盘,多 agent 任务管理 | 管理多个 agent 的中控台 | GitHub |
| self-improving-agent | 记录错误/纠正/学习到 Markdown,持续改进 agent 表现 | 命令失败、用户纠正时自动记录,下次不再犯 | GitHub |
| apple-reminders | 管理 Apple 提醒事项(via remindctl CLI) | macOS 用户本地集成 | GitHub |
| elevenlabs-tts | ElevenLabs 文字转语音,18 种角色,32 种语言 | 语音内容生成,带电话 fallback | Playbooks |
| mistral-ocr | PDF/图片转 Markdown | 文档数字化 | clawhub install mistral-ocr |
| imap-smtp-email | 邮件收发(Gmail/Outlook/163/126 等) | 自动化邮件处理 | GitHub |
| discord | Discord 全套操作:消息/表情/投票/线程/权限/审核 | 社区管理自动化,steipete 出品 | GitHub |
.claude/skills/ 使用| 来源 | 链接 |
|---|---|
| VoltAgent 精选列表(3,002 高质量技能,30+ 分类) | GitHub |
| 安仔新手推荐帖 | X/Twitter |
| Apiyi Top 10 推荐 | help.apiyi.com |
| Medium: 10 Must-Have Skills | Medium |
| DataCamp Top 100+ | DataCamp |
| OpenClaw 官方 Skills 仓库 | GitHub |
| ClawHub 文档 | docs.openclaw.ai |
| 安全审计报告 | clawhub Issue #95 |
github.com/anthropics/skills/tree/main/skills/skill-creator
| 维度 | 旧版 | 新版 |
|---|---|---|
| 定位 | 简单的技能创建指南 | 完整的技能开发框架 |
| 流程 | 写 SKILL.md → init → validate → package | 6 步评估驱动循环 |
| 测试 | 无 | 自动化 eval + 量化打分 |
| 对比 | 无 | with-skill vs baseline 盲测 |
| 评审 | 手动试几次凭感觉 | 浏览器端 eval-viewer |
| Description 优化 | 无 | 自动化 train-test split 循环 |
| 迭代 | 无 | 反馈 → 改进 → 重跑 → 循环 |
scripts/、references/、assets/ 目录evals/evals.jsonaggregate_benchmark.py 汇总统计(pass_rate、时间、tokens,含 mean ± stddev)→ Analyzer agent 分析模式 → generate_review.py 启动浏览器评审界面feedback.jsonrun_loop.py 自动循环:60/40 train-test split → 跑 3 次取平均 → Claude 提改进 → 最多 5 轮| Agent | 角色 | 说明 |
|---|---|---|
| Grader | 评分员 | 给每个 eval run 打分(pass/fail + 证据),量化技能效果 |
| Analyzer | 分析师 | 分析模式:哪些断言总是通过/失败、高方差 eval,找出改进方向 |
| Comparator | 对比员 | 盲测对比新旧版技能,不知道哪个是"新"哪个是"旧",避免偏见 |
| 脚本 | 功能 |
|---|---|
run_eval.py | 并行跑 with-skill / baseline 两组测试,调用 claude -p CLI |
aggregate_benchmark.py | 汇总统计:pass_rate、时间、tokens(含 mean ± stddev) |
generate_review.py | 生成浏览器端评审界面(eval-viewer) |
run_loop.py | Description 优化自动循环:train-test split → 跑 3 次取平均 → 最多 5 轮 |
init_skill.py | 初始化技能目录结构 |
quick_validate.py | 快速校验 SKILL.md 格式 |
package_skill.py | 打包技能准备发布 |
run_eval.py 和 run_loop.py 依赖 claude -p CLI,只能在 Claude Code 中用。
--static 导出 HTML。
| 环境 | 解决方式 |
|---|---|
| 本地 | 开一个 Claude Code / Codex / 其他外部 AI,让它帮你修复小龙虾——简单 |
| 云端 | 往往只能通过命令行解决——但命令行对新手不友好 |
| 今天的方法 | 在云端也装一个 CLI 工具(Qwen Code / Claude Code / Codex),用自然语言对话修复小龙虾 |
qwen 后,会看到设置界面:/auth 命令进入设置界面
/model 可以切换模型