跳到主要内容
feedback
feedback

开箱即用的智能体

PocketClaw 提供可直接使用的智能体能力。完成基础配置后,即可在界面中选择合适的智能体模板,快速开始任务。 对于大多数场景,不需要从零配置一个智能体。你只需要先判断任务类型,再选择最接近的模板,即可开始对话和执行。

智能体面板

系统预设了文档写作、代码助理、数据分析、社媒助手、旅行规划等常用场景的智能体模板,共计 29 个常用智能体,便于按任务直接选择。这些模板的设计目标,是让用户在不同工作场景下都能快速找到“开箱即可用”的助手,而不是每次都重新定义提示词和工具范围。

选择智能体时,建议优先按照任务目标来判断:

  • 需要生成结构化内容时,可优先选择文档写作类智能体
  • 需要编写、解释或排查代码时,可优先选择代码助理类智能体
  • 需要处理表格、统计或分析任务时,可优先选择数据分析类智能体
  • 需要策划内容、撰写文案或辅助分发时,可优先选择社媒助手类智能体
  • 需要整理行程、路线和清单时,可优先选择旅行规划类智能体

如果暂时不确定应该选择哪个模板,建议先从名称最接近当前目标的智能体开始,试运行一轮后再根据结果切换。

智能体面板

创建自定义智能体

如果现有模板无法满足需求,可以从头创建一个专属智能体。点击智能体面板右上角的 + 新建智能体 按钮,即可进入创建流程。

自定义智能体入口

创建流程共分为 5 步,支持"向导"和"原始 TOML"两种配置方式。使用向导模式时,按照步骤依次填写即可:

  1. 基础信息:填写智能体名称,选择图标与颜色,选择原型(如"自定义")
  2. 能力配置:设置智能体的核心职责和行为规则(系统提示词)
  3. 工具授权:选择该智能体可调用的工具范围
  4. 权限设置:设置默认权限模式(观察 / 协助 / 完整)
  5. 确认创建:预览配置并完成创建

自定义智能体五个步骤

创建完成后,新智能体会出现在"你的智能体"区域,可随时进入设置页进行后续调整。

工具介绍

我们已经为不同智能体打包了常用工具能力,覆盖:

  • agent 协作工具
  • 网络搜索
  • 文档解析
  • 图片生成
  • 音频生成
  • 图像理解
  • 定时任务创建

共计 30+ 工具。不同智能体会根据能力边界开放不同工具,因此实际可用范围会存在差异。 这意味着,智能体并不是“工具越多越好”。对于任务边界较清晰的智能体,系统会尽量只开放完成该类任务所需的工具,以减少误调用和不必要的复杂度。

  • 偏写作类的智能体,通常更关注搜索、阅读、整理和生成内容
  • 偏分析类的智能体,通常更关注结构化处理和结果归纳
  • 偏多媒体类的智能体,通常会更强调图片、音频或图像理解能力

这些多媒体能力基于模力方舟的模型能力构建,可用于覆盖更丰富的输入与输出场景。

智能体工具介绍

使用示例

以下示例展示了智能体调用内置工具的实际效果,覆盖图像生成、音频生成、新闻搜索和写作创作四个典型场景。

PocketClaw 界面微信渠道均可直接向智能体下达指令,两种方式使用的是同一套智能体能力,适用场景与输出结果基本一致。你可以根据自己的使用习惯选择入口,不需要重新配置。

图像生成

只需用自然语言描述想要的图片内容,智能体会自动调用图像生成工具完成创作,并将结果保存到工作区。

指令示例

"生成一张愚人节海报"

PocketClaw 界面微信
界面上生成图片微信生成图片

PocketClaw 界面会展示工具调用过程(image_generate)及生成结果的存储路径;微信渠道则直接将生成的图片发送到对话中。

音频生成

智能体支持将文字内容转化为音频输出,适合内容播报、配音、朗读等场景。

指令示例

"生成一句'你好,中国'的语音发给我"

PocketClaw 界面微信
界面生成音频微信生成音频

PocketClaw 界面会调用 text_to_speech 工具并在工作区保存音频文件;如果希望通过微信等渠道直接接收,需要在已绑定渠道的会话中发出指令,智能体会将音频文件直接发送到对话。

新闻搜索

智能体内置 Bing、DuckDuckGo 等搜索引擎,可实时检索信息并整理为结构化内容。

指令示例

"帮我查一查今天的科技新闻"

PocketClaw 界面微信
界面上查询科技新闻微信查询科技新闻

PocketClaw 界面会展示多轮 web_search 调用过程,并输出结构化的新闻摘要;微信渠道同样会返回整理好的新闻内容,格式适配移动端阅读习惯。

多agent协作

多智能体协作的核心思路是:让一个主控智能体(通常是 assistant)负责拆解任务,再将子任务分发给各个专项智能体执行,最终汇总结果。每个智能体只需专注于自己擅长的领域,主控智能体通过两个关键工具完成整个调度过程。

协作工具说明

工具用途
agent_list列出当前工作区内所有可用的智能体及其能力描述,供主控智能体选择合适的协作对象
agent_sent向指定智能体发送任务消息,触发该智能体执行并返回结果

协作流程大致为:

  1. 主控智能体收到用户指令
  2. 调用 agent_list 查询当前可用的智能体列表,了解各智能体的能力范围
  3. 根据任务需求,调用 agent_sent 向最合适的智能体下达子任务
  4. 子任务智能体执行完毕后,将结果返回给主控智能体
  5. 主控智能体整合所有子任务结果,生成最终输出

这种分工机制使得复杂任务可以被拆解为多个专项步骤并行或串行处理,充分发挥不同智能体在各自领域的优势。

示例:七言律诗创作

以"写作者"智能体为例,展示如何通过模板快速创建专属写作助手,并完成一次七言律诗创作任务。

在智能体模板面板中点击"写作者",系统会一键启动该智能体:

创建写作者

启动后,向 assistant 智能体下达创作指令。assistant 会先调用 agent_list 确认"写作者"智能体可用,再通过 agent_sent 将任务委派出去。在此之前,assistant 还会先通过网络搜索汇总背景信息,一并传递给写作者作为创作素材:

写作者接受任务

写作者智能体接收到任务后独立完成创作,输出完整的七言律诗,并附带创作说明与意象解析。结果通过 agent_sent 的返回值传回 assistant,最终呈现给用户:

利用写作者创作七言律诗

扩展思路

同一套协作机制适用于更复杂的场景。例如,可以让 assistant 同时调度"数据分析"智能体处理数据、"写作者"智能体生成报告、"社媒助手"智能体优化文案,三者的输出最终由 assistant 整合为一份完整的内容。

会话管理

通过会话管理页可以统一查看历史会话,并继续已有对话。对于需要多轮推进的任务,会话管理尤其重要。你可以把它理解为智能体的工作记录入口。

在这里,你可以:

  • 查看某个智能体过去执行过的任务记录
  • 继续之前尚未完成的对话
  • 回看历史上下文,减少重复输入

如果同一个任务需要持续几天推进,建议尽量在原有会话中继续操作,这样智能体更容易保持上下文一致性。

注意:每个渠道会独立分配一个会话,请避免会话串混

PocketClaw 界面本身有一个默认会话。如果你为智能体绑定了微信、飞书等通讯渠道,系统会为每个渠道也单独分配一个会话,与界面会话相互独立、互不共享上下文。

这意味着:

  • 你在微信里发出的指令,属于微信渠道的会话
  • 你在 PocketClaw 界面里的对话,属于界面会话
  • 两者的上下文不会自动合并,也不会相互感知

使用时请注意避免串混:

  • 不要通过不同渠道交替处理同一个任务,否则智能体在每个渠道里看到的上下文都是不完整的,容易产生重复操作或遗漏
  • 如需继续某个任务,请回到最初发起该任务的渠道中继续操作
  • 建议为不同使用场景固定一个入口(界面或某个渠道),保持会话的连续性与完整性

智能体会话管理

智能体设置

当某个智能体已基本符合需求,但仍需要细调风格、行为或权限时,可以进入设置页面进一步调整。在智能体列表中选择目标智能体后,即可进入设置页。

智能体设置入口

提示词与记忆

针对已有智能体,可以随时进入设置页编辑模板,调整系统提示词、人格,以及智能体在使用过程中累计的记忆内容。

这些设置分别影响智能体的不同层面:

  • 系统提示词:定义智能体的核心职责、输出格式、行为规则和回答边界
  • 人格:影响表达风格、语气、角色定位和交互体验
  • 记忆:保留智能体在长期使用过程中积累的重要上下文,帮助其在后续任务中延续理解

如果你的目标是“让它做同一类事,但说话方式或规则不同”,通常优先修改系统提示词和人格。

如果你的目标是“让它记住一段长期有效的信息”,则更适合维护记忆内容。

智能体设置记忆与提示词

权限

当使用场景发生变化时,也可以在设置中对智能体权限进行调整,控制其可调用的能力范围。

目前支持三种权限模式:

  • 观察:智能体以观察和分析为主,尽量不直接触发实际执行类操作
  • 协助:智能体可以完成部分辅助性任务,但会对高风险工具调用进行限制
  • 完整:允许智能体执行大部分任务,适合明确授权后的高自动化场景

在非“完整”模式下,部分操作会受到限制,例如文件创建、文件编辑以及脚本命令执行等。这类操作会流转到审批面板,由人工确认后再执行。

可以按下面的思路选择权限模式:

  • 如果当前主要是查看信息、整理内容、做方案和给建议,优先使用“观察”
  • 如果希望它参与执行,但又不希望完全放开高风险操作,优先使用“协助”
  • 如果任务本身已经明确、环境也可控,并且你希望提升自动化程度,可以使用“完整”

对于多人协作或正式业务环境,建议先从“观察”或“协助”开始,确认输出稳定后再逐步放宽权限。

智能体设置权限变更