开箱即用的智能体
PocketClaw 提供可直接使用的智能体能力。完成基础配置后,即可在界面中选择合适的智能体模板,快速开始任务。 对于大多数场景,不需要从零配置一个智能体。你只需要先判断任务类型,再选择最接近的模板,即可开始对话和执行。
智能体面板
系统预设了文档写作、代码助理、数据分析、社媒助手、旅行规划等常用场景的智能体模板,共计 29 个常用智能体,便于按任务直接选择。这些模板的设计目标,是让用户在不同工作场景下都能快速找到“开箱即可用”的助手,而不是每次都重新定义提示词和工具范围。
选择智能体时,建议优先按照任务目标来判断:
- 需要生成结构化内容时,可优先选择文档写作类智能体
- 需要编写、解释或排查代码时,可优先选择代码助理类智能体
- 需要处理表格、统计或分析任务时,可优先选 择数据分析类智能体
- 需要策划内容、撰写文案或辅助分发时,可优先选择社媒助手类智能体
- 需要整理行程、路线和清单时,可优先选择旅行规划类智能体
如果暂时不确定应该选择哪个模板,建议先从名称最接近当前目标的智能体开始,试运行一轮后再根据结果切换。

创建自定义智能体
如果现有模板无法满足需求,可以从头创建一个专属智能体。点击智能体面板右上角的 + 新建智能体 按钮,即可进入创建流程。

创建流程共分为 5 步,支持"向导"和"原始 TOML"两种配置方式。使用向导模式时,按照步骤依次填写即可:
- 基础信息:填写智能体名称,选择图标与颜色,选择原型(如"自定义")
- 能力配置:设置智能体的核心职责和行为规则(系统提示词)
- 工具授权:选择该智能体可调用的工具范围
- 权限设置:设置默认权限模式(观察 / 协助 / 完整)
- 确认创建:预览配置并完成创建

创建完成后,新智能体会出现在"你的智能体"区域,可随时进入设置页进行后续调整。
工具介绍
我们已经为不同智能体打包了常用工具能力,覆盖:
- agent 协作工具
- 网络搜索
- 文档解析
- 图片生成
- 音频生成
- 图像理解
- 定时任务创建
共计 30+ 工具。不同智能体会根据能力边界开放不同工具,因此实际可用范围会存在差异。 这意味着,智能体并不是“工具越多越好”。对于任务边界较清晰的智能体,系统会尽量只开放完成该类任务所需的工具,以减少误调用和不必要的复杂度。
- 偏写作类的智能体,通常更关注搜索、阅读、整理和生成内容
- 偏分析类的智能体,通常更关注结构化处理和结果归纳
- 偏多媒体类的智能体,通常会更强调图片、音频或图像理解能力
这些多媒体能力基于模力方舟的模型能力构建,可用于覆盖更丰富的输入与输出场景。

使用示例
以下示例展示了智能体调用内置工具的实际效果,覆盖图像生成、音频生成、新闻搜索和写作创作四个典型场景。
PocketClaw 界面与微信渠道均可直接向智能体下达指令,两种方式使用的是同一套智能体能力,适用场景与输出结果基本一致。你可以根据自己的使用习惯选择入口,不需要重新配置。
图像生成
只需用自然语言描述想要的图片内容,智能体会自动调用图像生成工具完成创作,并将结果保存到工作区。
"生成一张愚人节海报"
| PocketClaw 界面 | 微信 |
|---|---|
![]() | ![]() |
PocketClaw 界面会展示工具调用过程(image_generate)及生成结果的存储路径;微信渠道则直接将生成的图片发送到对话中。
音频生成
智能体支持将文字内容转化为音频输出,适合内容播报、配音、朗读等场景。
"生成一句'你好,中国'的语音发给我"
| PocketClaw 界面 | 微信 |
|---|---|
![]() | ![]() |
PocketClaw 界面会调用 text_to_speech 工具并在工作区保存音频文件;如果希望通过微信等渠道直接接收,需要在已绑定渠道的会话中发出指令,智能体会将音频文件直接发送到对话。
新闻搜索
智能体内置 Bing、DuckDuckGo 等搜索引擎,可实时检索信息并整理为结构化内容。
"帮我查一查今天的科技新闻"
| PocketClaw 界面 | 微信 |
|---|---|
![]() | ![]() |
PocketClaw 界面会展示多轮 web_search 调用过程,并输出结构化的新闻摘要;微信渠道同样会返回整理好的新闻内容,格式适配移动端阅读习惯。
多agent协作
多智能体协作的核心思路是:让一个主控智能体(通常是 assistant)负责拆解任务,再将子任务分发给各个专项智能体执行,最终汇总结果。每个智能体只需专注于自己擅长的领域,主控智能体通过两个关键工具完成整个调度过程。
协作工具说明
| 工具 | 用途 |
|---|---|
agent_list | 列出当前工作区内所有可用的智能体及其能力描述,供主控智能体选择合适的协作对象 |
agent_sent | 向指定智能体发送任务消息,触发该智能体执行并返回结果 |
协作流程大致为:
- 主控智能体收到用户指令
- 调用
agent_list查询当前可用的智能体列表,了解各智能体的能力范围 - 根据任务需求,调用
agent_sent向最合适的智能体下达子任务 - 子任务智能体执行完毕后,将结果返回给主控智能体
- 主控智能体整合所有子任务结果,生成最终输出
这种分工机制使得复杂任务可以被拆解为多个专项步骤并行或串行处理,充分发挥不同智能体在各自领域的优势。
示例:七言律诗创作
以"写作者"智能体为例,展示如何通过模板快速创建专属写作助手,并完成一次七言律诗创作任务。
在智能体模板面板中点击"写作者",系统会一键启动该智能体:

启动后,向 assistant 智能体下达创作指令。assistant 会先调用 agent_list 确认"写作者"智能体可用,再通过 agent_sent 将任务委派出去。在此之前,assistant 还会先通过网络搜索汇总背景信息,一并传递给写作者作为创作素材:

写作者智能体接收到任务后独立完成创作,输出完整的七言律诗,并附带创作说明与意象解析。结果通过 agent_sent 的返回值传回 assistant,最终呈现给用户:





