feat: 新增 account 和 plan 目录
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
122
account/admin/skills/system/browser-task/SKILL.md
Normal file
122
account/admin/skills/system/browser-task/SKILL.md
Normal file
@@ -0,0 +1,122 @@
|
||||
---
|
||||
name: browser-task
|
||||
description: 智能浏览器任务 - 描述任务,自动完成(推荐优先使用)
|
||||
system: true
|
||||
handler: browser
|
||||
tool-name: browser_task
|
||||
category: Browser
|
||||
priority: high
|
||||
---
|
||||
|
||||
# browser_task - 智能浏览器任务
|
||||
|
||||
**推荐优先使用** - 这是浏览器操作的首选工具。
|
||||
|
||||
基于 [browser-use](https://github.com/browser-use/browser-use) 开源项目实现。
|
||||
|
||||
## 用法
|
||||
|
||||
```python
|
||||
browser_task(
|
||||
task="要完成的任务描述",
|
||||
max_steps=15 # 可选,默认 15
|
||||
)
|
||||
```
|
||||
|
||||
## 参数
|
||||
|
||||
| 参数 | 类型 | 必填 | 说明 |
|
||||
|------|------|------|------|
|
||||
| task | string | 是 | 任务描述,用自然语言描述你想完成的操作 |
|
||||
| max_steps | integer | 否 | 最大执行步骤数,默认 15 |
|
||||
|
||||
## 何时使用(优先)
|
||||
|
||||
- 任何涉及多步骤的浏览器操作
|
||||
- 网页搜索、表单填写、信息提取
|
||||
- 不确定具体操作步骤时
|
||||
- 复杂的网页交互流程
|
||||
|
||||
## 示例
|
||||
|
||||
### 搜索任务
|
||||
```python
|
||||
browser_task(task="打开百度搜索福建福州天气")
|
||||
```
|
||||
|
||||
### 表单填写
|
||||
```python
|
||||
browser_task(task="打开 example.com 的注册页面,填写用户名 test123")
|
||||
```
|
||||
|
||||
### 信息提取
|
||||
```python
|
||||
browser_task(task="打开 GitHub 首页,获取今日热门项目的名称")
|
||||
```
|
||||
|
||||
### 截图任务
|
||||
```python
|
||||
browser_task(task="打开百度搜索福建福州,截图保存")
|
||||
```
|
||||
|
||||
## 何时使用细粒度工具
|
||||
|
||||
仅在以下情况使用 `browser_navigate`、`browser_click` 等细粒度工具:
|
||||
|
||||
- `browser_task` 执行失败需要手动介入
|
||||
- 仅需单步操作(如只截图 `browser_screenshot`)
|
||||
- 需要精确控制特定元素
|
||||
|
||||
## 返回值
|
||||
|
||||
```json
|
||||
{
|
||||
"success": true,
|
||||
"result": {
|
||||
"task": "打开百度搜索福建福州",
|
||||
"steps_taken": 5,
|
||||
"final_result": "搜索完成,已显示福建福州相关结果",
|
||||
"message": "任务完成: 打开百度搜索福建福州"
|
||||
}
|
||||
}
|
||||
```
|
||||
|
||||
## 注意事项
|
||||
|
||||
1. 任务描述要清晰具体,避免歧义
|
||||
2. 复杂任务可能需要增加 max_steps
|
||||
3. 首次使用会自动启动浏览器(可见模式)
|
||||
4. **自动继承系统 LLM 配置**,无需额外配置 API Key
|
||||
|
||||
## 技术细节
|
||||
|
||||
- 通过 CDP (Chrome DevTools Protocol) 复用 OpenAkita 已启动的浏览器
|
||||
- 自动继承 OpenAkita 系统配置的 LLM(来自 llm_endpoints.json)
|
||||
- 基于 [browser-use](https://github.com/browser-use/browser-use) 开源项目
|
||||
|
||||
## 高级:操作用户已打开的 Chrome
|
||||
|
||||
如果想让 OpenAkita 操作你已打开的 Chrome 页面,需要以调试模式启动 Chrome:
|
||||
|
||||
**Windows:**
|
||||
```cmd
|
||||
"C:\Program Files\Google\Chrome\Application\chrome.exe" --remote-debugging-port=9222
|
||||
```
|
||||
|
||||
**macOS:**
|
||||
```bash
|
||||
/Applications/Google\ Chrome.app/Contents/MacOS/Google\ Chrome --remote-debugging-port=9222
|
||||
```
|
||||
|
||||
**Linux:**
|
||||
```bash
|
||||
google-chrome --remote-debugging-port=9222
|
||||
```
|
||||
|
||||
启动后,OpenAkita 会自动检测并连接,可以操作你已打开的标签页。
|
||||
|
||||
## 相关技能
|
||||
|
||||
- `browser_screenshot` - 单独截图
|
||||
- `browser_navigate` - 单独导航
|
||||
- `deliver_artifacts` - 发送结果给用户
|
||||
Reference in New Issue
Block a user