Files
X-Agents/account/admin/skills/system/browser-task/SKILL.md
2026-03-11 16:26:22 +08:00

123 lines
3.0 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
name: browser-task
description: 智能浏览器任务 - 描述任务,自动完成(推荐优先使用)
system: true
handler: browser
tool-name: browser_task
category: Browser
priority: high
---
# browser_task - 智能浏览器任务
**推荐优先使用** - 这是浏览器操作的首选工具。
基于 [browser-use](https://github.com/browser-use/browser-use) 开源项目实现。
## 用法
```python
browser_task(
task="要完成的任务描述",
max_steps=15 # 可选,默认 15
)
```
## 参数
| 参数 | 类型 | 必填 | 说明 |
|------|------|------|------|
| task | string | 是 | 任务描述,用自然语言描述你想完成的操作 |
| max_steps | integer | 否 | 最大执行步骤数,默认 15 |
## 何时使用(优先)
- 任何涉及多步骤的浏览器操作
- 网页搜索、表单填写、信息提取
- 不确定具体操作步骤时
- 复杂的网页交互流程
## 示例
### 搜索任务
```python
browser_task(task="打开百度搜索福建福州天气")
```
### 表单填写
```python
browser_task(task="打开 example.com 的注册页面,填写用户名 test123")
```
### 信息提取
```python
browser_task(task="打开 GitHub 首页,获取今日热门项目的名称")
```
### 截图任务
```python
browser_task(task="打开百度搜索福建福州,截图保存")
```
## 何时使用细粒度工具
仅在以下情况使用 `browser_navigate``browser_click` 等细粒度工具:
- `browser_task` 执行失败需要手动介入
- 仅需单步操作(如只截图 `browser_screenshot`
- 需要精确控制特定元素
## 返回值
```json
{
"success": true,
"result": {
"task": "打开百度搜索福建福州",
"steps_taken": 5,
"final_result": "搜索完成,已显示福建福州相关结果",
"message": "任务完成: 打开百度搜索福建福州"
}
}
```
## 注意事项
1. 任务描述要清晰具体,避免歧义
2. 复杂任务可能需要增加 max_steps
3. 首次使用会自动启动浏览器(可见模式)
4. **自动继承系统 LLM 配置**,无需额外配置 API Key
## 技术细节
- 通过 CDP (Chrome DevTools Protocol) 复用 OpenAkita 已启动的浏览器
- 自动继承 OpenAkita 系统配置的 LLM来自 llm_endpoints.json
- 基于 [browser-use](https://github.com/browser-use/browser-use) 开源项目
## 高级:操作用户已打开的 Chrome
如果想让 OpenAkita 操作你已打开的 Chrome 页面,需要以调试模式启动 Chrome
**Windows:**
```cmd
"C:\Program Files\Google\Chrome\Application\chrome.exe" --remote-debugging-port=9222
```
**macOS:**
```bash
/Applications/Google\ Chrome.app/Contents/MacOS/Google\ Chrome --remote-debugging-port=9222
```
**Linux:**
```bash
google-chrome --remote-debugging-port=9222
```
启动后OpenAkita 会自动检测并连接,可以操作你已打开的标签页。
## 相关技能
- `browser_screenshot` - 单独截图
- `browser_navigate` - 单独导航
- `deliver_artifacts` - 发送结果给用户