跳到主要内容

OpenClaw 教程

欢迎学习 OpenClaw!本教程将带你从零开始掌握这款个人 AI 助手框架,让你在自己的设备上运行一个真正"能干活"的 AI。

什么是 OpenClaw?

OpenClaw 是一款自托管的个人 AI 助手,你可以把它理解为一个运行在自己设备上的智能代理。它的核心价值在于连接你常用的聊天应用(WhatsApp、Telegram、Slack、Discord、飞书、微信等)与 AI 能力,让 AI 能够在你熟悉的聊天界面中帮你处理各种任务。

用一句话概括:OpenClaw = Gateway 网关 + 多渠道接入 + AI Agent + 工具调用能力

核心定义

OpenClaw 是一个自托管的 Gateway(网关),它连接你喜欢的聊天应用到 AI 编码代理。你在自己的设备上运行它,所有数据都在本地存储。它支持 WhatsApp、Telegram、Slack、Discord、iMessage、Signal、飞书、微信等 20+ 种消息平台,让你无需安装专用客户端,直接通过日常使用的聊天工具与 AI 交互。

与传统 AI 工具的区别

传统 AI 工具通常需要你打开特定的应用或网页,在工作流中存在明显的"上下文切换"成本。OpenClaw 的设计理念完全不同——让 AI 融入你已有的工作流。

维度传统 AI 工具OpenClaw
交互界面专用应用/网页你已有的聊天软件
数据存储云端为主本地优先,完全掌控
记忆能力会话结束即失忆持久记忆,跨会话保持
工具调用受限于平台能力完整的本地执行能力
隐私控制依赖服务商完全自主可控

OpenClaw 能做什么?

聊天与对话

  • 通过 WhatsApp、Telegram、Slack、Discord 等熟悉的聊天工具与 AI 交流
  • 支持私聊和群聊,群聊中可通过 @ 提及触发
  • 语音输入支持(macOS/iOS/Android)

文件与代码操作

  • 读写本地文件系统,处理各种格式文件
  • 执行 Shell 命令、运行脚本
  • 代码编写、调试、重构
  • Git 操作、项目构建

浏览器自动化

  • 打开网页、导航、截图
  • 填写表单、点击按钮
  • 抓取网页数据
  • 自动登录和保持会话状态

智能记忆

  • 记住你的偏好、习惯、常用配置
  • 跨会话保持上下文
  • 自动总结和压缩历史对话
  • 支持向量搜索快速检索记忆

多设备协同

  • macOS 菜单栏应用,支持语音唤醒
  • iOS/Android 配套应用,支持相机、屏幕录制、通知等设备能力
  • Canvas 画布功能,AI 可以渲染交互式界面

为什么选择 OpenClaw?

自托管,隐私优先

所有数据(对话记录、记忆文件、配置)都存储在你自己的设备上。你完全掌控自己的数据,无需担心敏感信息被上传到云端或被第三方访问。

零学习成本

无需安装专用客户端,直接通过你每天都在用的聊天软件与 AI 交互。支持 20+ 种消息平台:

主流即时通讯:WhatsApp、Telegram、Signal、iMessage(BlueBubbles)、微信、LINE

团队协作平台:Slack、Discord、Microsoft Teams、Mattermost、Google Chat、飞书

其他渠道:IRC、Matrix、Nostr、QQ Bot、WebChat、Synology Chat、Nextcloud Talk、Twitch、Zalo

真正的工具调用能力

不同于只能"聊天"的 AI,OpenClaw 的 Agent 可以:

  • 执行 Shell 命令和脚本
  • 读写和编辑文件
  • 控制浏览器进行网页操作
  • 调用各种工具和技能(Skills)

持久记忆系统

OpenClaw 通过本地 Markdown 文件实现记忆持久化:

  • MEMORY.md - 存储重要事实和偏好
  • SOUL.md - 定义 AI 的人格和行为模式
  • AGENTS.md - 配置 Agent 的能力和约束

记忆会自动总结和压缩,确保 AI 在长期使用中越来越"懂你"。

多 Agent 支持

一台 Gateway 可以运行多个独立的 Agent,每个 Agent 有独立的工作空间、记忆和人格。这让你可以:

  • 为工作和生活配置不同的人格
  • 让不同家庭成员使用独立的 AI 助手
  • 为不同项目配置专用的 Agent

核心概念

Gateway(网关)

Gateway 是 OpenClaw 的核心组件,是一个长期运行的守护进程。它负责:

  • 维护所有消息渠道的连接(WhatsApp、Telegram、Slack 等)
  • 提供 WebSocket API 供客户端连接
  • 管理 Agent 会话和状态
  • 协调工具调用和任务执行

一个主机上运行一个 Gateway,默认监听 127.0.0.1:18789

Agent(智能体)

Agent 是执行任务的 AI"大脑"。每个 Agent 拥有:

  • 工作空间(Workspace):文件操作的根目录,包含配置文件和记忆文件
  • 状态目录(agentDir):存储认证配置、模型注册、会话数据
  • 会话存储:聊天历史和路由状态

默认情况下,OpenClaw 运行一个 main Agent,你可以配置多个独立的 Agent。

Skills(技能)

Skills 是 Agent 的能力扩展模块,定义了 Agent 能执行的具体操作。OpenClaw 内置了文件操作、命令执行、浏览器控制等核心技能,你也可以安装社区技能或开发自定义技能。

Memory(记忆)

Memory 是 OpenClaw 的持久化记忆系统。Agent 通过写入本地 Markdown 文件来"记住"信息:

  • MEMORY.md - 存储重要事实、用户偏好、业务规则
  • memory/YYYY-MM-DD.md - 按日期存储的日记式记忆
  • SOUL.md - 定义 Agent 的人格、行为模式、语言风格
  • AGENTS.md - 配置 Agent 的能力说明和约束

Channels(渠道)

Channels 是 OpenClaw 与用户交互的通道。每个渠道连接一个消息平台(如 Telegram、WhatsApp),用户通过这些平台发送消息给 Agent,Agent 的回复也通过同一渠道返回。

Nodes(节点)

Nodes 是连接到 Gateway 的设备客户端,包括:

  • macOS 应用:菜单栏控制、语音唤醒
  • iOS/Android 应用:相机、屏幕录制、通知等设备能力
  • 提供 canvascamerascreen.recordlocation.get 等设备级功能

项目背景

OpenClaw 是一个开源的个人 AI 助手框架,核心开发语言为 TypeScript。项目的吉祥物是一只红色的龙虾,口号是 "Your own personal AI assistant. Any OS. Any Platform. The lobster way."

核心架构

OpenClaw 的 Agent 运行时基于 Pi(一个 AI 编码代理核心)构建。Pi 是一个强大的 AI 编码代理框架,提供模型调用、工具使用和提示词管道。OpenClaw 将 Pi 嵌入到消息网关架构中,实现以下能力:

  • 嵌入模式:Agent 运行时直接嵌入在 Gateway 进程中,无需子进程或 RPC 通信
  • 会话管理:OpenClaw 负责会话管理、发现、工具连接和渠道投递
  • 工具生态:继承 Pi 的完整工具能力,包括文件操作、命令执行、浏览器控制等
  • 多模型支持:支持 Anthropic、OpenAI、Google、DeepSeek 等 30+ 模型提供商

架构图展示了 OpenClaw 的核心组件及其交互关系:

运行环境

OpenClaw 支持在 macOS、Linux、Windows(推荐通过 WSL2)上运行,也支持 Docker 部署。得益于 Node.js 的跨平台特性,可以在树莓派等小型设备上运行。

设计理念

项目的设计初衷是打造一个真正属于用户的个人 AI 助手——运行在自己的设备上,通过用户已有的聊天软件交互,能够执行实际的工具调用任务。与需要专用客户端或网页界面的 AI 工具不同,OpenClaw 选择融入用户已有的工作流,让 AI 变得触手可及。

教程目录

入门基础

核心功能

高级应用

实战与故障排查

参考资料

学习建议

  1. 先跑通基础:按照安装教程完成部署,推荐使用 WSL2 环境
  2. 理解核心概念:掌握 Gateway、Agent、Workspace、Memory 等核心概念
  3. 配置一个渠道:先配置 Telegram 或 WebChat,熟悉基本交互
  4. 探索技能系统:安装一些有用的 Skills,扩展 Agent 能力
  5. 定制记忆:根据自己的需求定制 MEMORY.md 和 SOUL.md

参考资源

准备好开始学习了吗?点击下一章开始安装部署。