OpenClaw 教程

欢迎学习 OpenClaw！本教程将带你从零开始掌握这款个人 AI 助手框架，让你在自己的设备上运行一个真正"能干活"的 AI。

什么是 OpenClaw？

OpenClaw 是一款自托管的个人 AI 助手，你可以把它理解为一个运行在自己设备上的智能代理。它的核心价值在于连接你常用的聊天应用（WhatsApp、Telegram、Slack、Discord、飞书、微信等）与 AI 能力，让 AI 能够在你熟悉的聊天界面中帮你处理各种任务。

用一句话概括：OpenClaw = Gateway 网关 + 多渠道接入 + AI Agent + 工具调用能力。

核心定义

OpenClaw 是一个自托管的 Gateway（网关），它连接你喜欢的聊天应用到 AI 编码代理。你在自己的设备上运行它，所有数据都在本地存储。它支持 WhatsApp、Telegram、Slack、Discord、iMessage、Signal、飞书、微信等 20+ 种消息平台，让你无需安装专用客户端，直接通过日常使用的聊天工具与 AI 交互。

与传统 AI 工具的区别

传统 AI 工具通常需要你打开特定的应用或网页，在工作流中存在明显的"上下文切换"成本。OpenClaw 的设计理念完全不同——让 AI 融入你已有的工作流。

维度	传统 AI 工具	OpenClaw
交互界面	专用应用/网页	你已有的聊天软件
数据存储	云端为主	本地优先，完全掌控
记忆能力	会话结束即失忆	持久记忆，跨会话保持
工具调用	受限于平台能力	完整的本地执行能力
隐私控制	依赖服务商	完全自主可控

OpenClaw 能做什么？

聊天与对话

通过 WhatsApp、Telegram、Slack、Discord 等熟悉的聊天工具与 AI 交流
支持私聊和群聊，群聊中可通过 @ 提及触发
语音输入支持（macOS/iOS/Android）

文件与代码操作

读写本地文件系统，处理各种格式文件
执行 Shell 命令、运行脚本
代码编写、调试、重构
Git 操作、项目构建

浏览器自动化

打开网页、导航、截图
填写表单、点击按钮
抓取网页数据
自动登录和保持会话状态

智能记忆

记住你的偏好、习惯、常用配置
跨会话保持上下文
自动总结和压缩历史对话
支持向量搜索快速检索记忆

多设备协同

macOS 菜单栏应用，支持语音唤醒
iOS/Android 配套应用，支持相机、屏幕录制、通知等设备能力
Canvas 画布功能，AI 可以渲染交互式界面

为什么选择 OpenClaw？

自托管，隐私优先

所有数据（对话记录、记忆文件、配置）都存储在你自己的设备上。你完全掌控自己的数据，无需担心敏感信息被上传到云端或被第三方访问。

零学习成本

无需安装专用客户端，直接通过你每天都在用的聊天软件与 AI 交互。支持 20+ 种消息平台：

主流即时通讯：WhatsApp、Telegram、Signal、iMessage（BlueBubbles）、微信、LINE

团队协作平台：Slack、Discord、Microsoft Teams、Mattermost、Google Chat、飞书

其他渠道：IRC、Matrix、Nostr、QQ Bot、WebChat、Synology Chat、Nextcloud Talk、Twitch、Zalo

真正的工具调用能力

不同于只能"聊天"的 AI，OpenClaw 的 Agent 可以：

执行 Shell 命令和脚本
读写和编辑文件
控制浏览器进行网页操作
调用各种工具和技能（Skills）

持久记忆系统

OpenClaw 通过本地 Markdown 文件实现记忆持久化：

MEMORY.md - 存储重要事实和偏好
SOUL.md - 定义 AI 的人格和行为模式
AGENTS.md - 配置 Agent 的能力和约束

记忆会自动总结和压缩，确保 AI 在长期使用中越来越"懂你"。

多 Agent 支持

一台 Gateway 可以运行多个独立的 Agent，每个 Agent 有独立的工作空间、记忆和人格。这让你可以：

为工作和生活配置不同的人格
让不同家庭成员使用独立的 AI 助手
为不同项目配置专用的 Agent

核心概念

Gateway（网关）

Gateway 是 OpenClaw 的核心组件，是一个长期运行的守护进程。它负责：

维护所有消息渠道的连接（WhatsApp、Telegram、Slack 等）
提供 WebSocket API 供客户端连接
管理 Agent 会话和状态
协调工具调用和任务执行

一个主机上运行一个 Gateway，默认监听 127.0.0.1:18789。

Agent（智能体）

Agent 是执行任务的 AI"大脑"。每个 Agent 拥有：

工作空间（Workspace）：文件操作的根目录，包含配置文件和记忆文件
状态目录（agentDir）：存储认证配置、模型注册、会话数据
会话存储：聊天历史和路由状态

默认情况下，OpenClaw 运行一个 main Agent，你可以配置多个独立的 Agent。

Skills（技能）

Skills 是 Agent 的能力扩展模块，定义了 Agent 能执行的具体操作。OpenClaw 内置了文件操作、命令执行、浏览器控制等核心技能，你也可以安装社区技能或开发自定义技能。

Memory（记忆）

Memory 是 OpenClaw 的持久化记忆系统。Agent 通过写入本地 Markdown 文件来"记住"信息：

MEMORY.md - 存储重要事实、用户偏好、业务规则
memory/YYYY-MM-DD.md - 按日期存储的日记式记忆
SOUL.md - 定义 Agent 的人格、行为模式、语言风格
AGENTS.md - 配置 Agent 的能力说明和约束

Channels（渠道）

Channels 是 OpenClaw 与用户交互的通道。每个渠道连接一个消息平台（如 Telegram、WhatsApp），用户通过这些平台发送消息给 Agent，Agent 的回复也通过同一渠道返回。

Nodes（节点）

Nodes 是连接到 Gateway 的设备客户端，包括：

macOS 应用：菜单栏控制、语音唤醒
iOS/Android 应用：相机、屏幕录制、通知等设备能力
提供 canvas、camera、screen.record、location.get 等设备级功能

项目背景

OpenClaw 是一个开源的个人 AI 助手框架，核心开发语言为 TypeScript。项目的吉祥物是一只红色的龙虾，口号是 "Your own personal AI assistant. Any OS. Any Platform. The lobster way."

核心架构

OpenClaw 的 Agent 运行时基于 Pi（一个 AI 编码代理核心）构建。Pi 是一个强大的 AI 编码代理框架，提供模型调用、工具使用和提示词管道。OpenClaw 将 Pi 嵌入到消息网关架构中，实现以下能力：

嵌入模式：Agent 运行时直接嵌入在 Gateway 进程中，无需子进程或 RPC 通信
会话管理：OpenClaw 负责会话管理、发现、工具连接和渠道投递
工具生态：继承 Pi 的完整工具能力，包括文件操作、命令执行、浏览器控制等
多模型支持：支持 Anthropic、OpenAI、Google、DeepSeek 等 30+ 模型提供商

架构图展示了 OpenClaw 的核心组件及其交互关系：

运行环境

OpenClaw 支持在 macOS、Linux、Windows（推荐通过 WSL2）上运行，也支持 Docker 部署。得益于 Node.js 的跨平台特性，可以在树莓派等小型设备上运行。

设计理念

项目的设计初衷是打造一个真正属于用户的个人 AI 助手——运行在自己的设备上，通过用户已有的聊天软件交互，能够执行实际的工具调用任务。与需要专用客户端或网页界面的 AI 工具不同，OpenClaw 选择融入用户已有的工作流，让 AI 变得触手可及。

教程目录

入门基础

安装部署 - 全平台安装指南（推荐 WSL2 + Node 24）
快速开始 - 完成首次配置和运行
核心概念 - 深入理解 Gateway、Agent、Memory 等核心概念

核心功能

Skills 技能系统 - 安装、使用、开发自定义技能
Memory 记忆系统 - 配置和管理 AI 的持久记忆
定时任务 - Cron 定时任务配置
渠道接入 - 连接 WhatsApp、Telegram、Slack 等通讯平台

高级应用

多 Agent 协作 - 配置多个独立的 Agent
浏览器自动化 - CDP 浏览器控制
最佳实践 - 生产环境部署与优化

实战与故障排查

实战案例 - 完整的端到端应用案例
故障排查 - 常见问题诊断与解决

参考资料

速查表 - 常用命令和配置速查

学习建议

先跑通基础：按照安装教程完成部署，推荐使用 WSL2 环境
理解核心概念：掌握 Gateway、Agent、Workspace、Memory 等核心概念
配置一个渠道：先配置 Telegram 或 WebChat，熟悉基本交互
探索技能系统：安装一些有用的 Skills，扩展 Agent 能力
定制记忆：根据自己的需求定制 MEMORY.md 和 SOUL.md

参考资源

OpenClaw 官方文档 - 完整的配置和 API 参考
OpenClaw GitHub 仓库 - 源码和问题反馈
ClawHub 技能市场 - 社区技能分享平台
Discord 社区 - 用户交流和开发者支持

什么是 OpenClaw？​

核心定义​

与传统 AI 工具的区别​

OpenClaw 能做什么？​

聊天与对话​

文件与代码操作​

浏览器自动化​

智能记忆​

多设备协同​

为什么选择 OpenClaw？​

自托管，隐私优先​

零学习成本​

真正的工具调用能力​

持久记忆系统​

多 Agent 支持​

核心概念​

Gateway（网关）​

Agent（智能体）​

Skills（技能）​

Memory（记忆）​

Channels（渠道）​

Nodes（节点）​

项目背景​

核心架构​

运行环境​

设计理念​

教程目录​

入门基础​

核心功能​

高级应用​

实战与故障排查​

参考资料​

学习建议​

参考资源​