docs(agent-week-plan): update weekly plan documents

- MASTER_TODO.md: update master todo list
- day_3_semantic_ontology_mvp.md: update semantic ontology tasks
- day_4_orchestrator_runtime.md: update orchestrator runtime tasks
- day_5_user_agent_mvp.md: update user agent tasks
This commit is contained in:
caoxiaozhu
2026-05-12 06:33:55 +00:00
parent d81ac10894
commit 8227e0ab5c
4 changed files with 29 additions and 15 deletions

View File

@@ -29,9 +29,9 @@
| --- | --- | --- | --- | --- | --- | | --- | --- | --- | --- | --- | --- |
| Day 1 | 已完成2026-05-11 | 基础模型与工程骨架 | 资产、版本、审核、运行日志、审计日志、基础 API、最小财务数据源 | [Day 1](./day_1_foundation_models.md) | [HTML](<../agent_week_plan_html/day-1.html>) | | Day 1 | 已完成2026-05-11 | 基础模型与工程骨架 | 资产、版本、审核、运行日志、审计日志、基础 API、最小财务数据源 | [Day 1](./day_1_foundation_models.md) | [HTML](<../agent_week_plan_html/day-1.html>) |
| Day 2 | 已完成,待补浏览器走查记录 | 任务规则中心联调 | 规则/技能/MCP/任务列表与详情、Markdown、版本、审核 | [Day 2](./day_2_rule_center_integration.md) | [HTML](<../agent_week_plan_html/day-2.html>) | | Day 2 | 已完成,待补浏览器走查记录 | 任务规则中心联调 | 规则/技能/MCP/任务列表与详情、Markdown、版本、审核 | [Day 2](./day_2_rule_center_integration.md) | [HTML](<../agent_week_plan_html/day-2.html>) |
| Day 3 | 已完成主体功能,待补评测样本扩充 | 语义本体 MVP | 8 字段语义解析、日志、评测入口、OCR 摘要语义带入 | [Day 3](./day_3_semantic_ontology_mvp.md) | [HTML](<../agent_week_plan_html/day-3.html>) | | Day 3 | 已完成主体功能,待补评测样本扩充 | 语义本体 MVP | 8 字段语义解析、日志、评测入口、OCR 摘要与最小会话上下文带入 | [Day 3](./day_3_semantic_ontology_mvp.md) | [HTML](<../agent_week_plan_html/day-3.html>) |
| Day 4 | 已完成主干,待接通真实报销写链路 | Orchestrator 运行时 | 统一入口、路由、权限、工具调用、报销单写入路由、Trace | [Day 4](./day_4_orchestrator_runtime.md) | [HTML](<../agent_week_plan_html/day-4.html>) | | Day 4 | 已完成主干与会话串联,待接通提交/附件持久化链路 | Orchestrator 运行时 | 统一入口、路由、权限、工具调用、报销单写入路由、会话 Trace | [Day 4](./day_4_orchestrator_runtime.md) | [HTML](<../agent_week_plan_html/day-4.html>) |
| Day 5 | 已完成问答主链路与 OCR 上下文透传,待接通真实报销落库与状态流转 | User Agent MVP | 用户问答、报销单草稿创建/补全/提交、财务查询、规则解释、附件/OCR 带入 | [Day 5](./day_5_user_agent_mvp.md) | [HTML](<../agent_week_plan_html/day-5.html>) | | Day 5 | 已完成问答主链路、草稿创建/补全与会话上下文,待接通提交状态流转 | User Agent MVP | 用户问答、报销单草稿创建/补全/提交、财务查询、规则解释、附件/OCR 带入 | [Day 5](./day_5_user_agent_mvp.md) | [HTML](<../agent_week_plan_html/day-5.html>) |
| Day 6 | 未开始 | Hermes MVP | 定时任务、风险巡检、日报、知识候选、规则草稿 | [Day 6](./day_6_hermes_mvp.md) | [HTML](<../agent_week_plan_html/day-6.html>) | | Day 6 | 未开始 | Hermes MVP | 定时任务、风险巡检、日报、知识候选、规则草稿 | [Day 6](./day_6_hermes_mvp.md) | [HTML](<../agent_week_plan_html/day-6.html>) |
| Day 7 | 未开始 | 加固、演示和验收 | 回归、测试、演示脚本、交付说明 | [Day 7](./day_7_hardening_demo_acceptance.md) | [HTML](<../agent_week_plan_html/day-7.html>) | | Day 7 | 未开始 | 加固、演示和验收 | 回归、测试、演示脚本、交付说明 | [Day 7](./day_7_hardening_demo_acceptance.md) | [HTML](<../agent_week_plan_html/day-7.html>) |
@@ -39,17 +39,17 @@
- Day 1 已完成,后端基础模型、审计和最小财务数据源已可供后续能力复用。 - Day 1 已完成,后端基础模型、审计和最小财务数据源已可供后续能力复用。
- Day 2 已完成主要前后端联调,当前仅剩浏览器人工走查记录待补。 - Day 2 已完成主要前后端联调,当前仅剩浏览器人工走查记录待补。
- Day 3 主体已完成,`/api/v1/ontology/parse`、8 字段返回、缺槽位追问、权限判断和前端调试入口均已落地OCR 摘要附件上下文已进入语义层,当前主要剩叙述型报销、附件/OCR 带入样本和模糊追问样本继续扩充。 - Day 3 主体已完成,`/api/v1/ontology/parse`、8 字段返回、缺槽位追问、权限判断和前端调试入口均已落地OCR 摘要附件上下文和最小会话历史已进入语义层,当前主要剩叙述型报销、附件/OCR 带入样本和模糊追问样本继续扩充。
- Day 4 主干已完成Orchestrator 已具备统一入口、User Agent / Hermes 路由、权限阻断、ToolCall 记录、Trace 和降级`expense_claims` 草稿建单与 ToolCall / Audit 已接通,但改单、提交、附件持久化和更细的 ToolCall Trace 仍未接通。 - Day 4 主干已完成Orchestrator 已具备统一入口、User Agent / Hermes 路由、权限阻断、ToolCall 记录、Trace、降级和 `conversation_id` 会话串联`expense_claims` 草稿建单/改单与 ToolCall / Audit 已接通,但提交、附件持久化和更细的 ToolCall Trace 仍未接通。
- Day 5 问答主链路已完成个人工作台和报销对话框已能把文本、附件名称、OCR 摘要页面上下文带入 Orchestrator并返回回答、规则引用、风险说明结构化草稿;真实报销主表 / 明细草稿落库已接通,但附件 / OCR 结果落库及 `draft -> submitted` 仍未完成。 - Day 5 问答主链路已完成个人工作台和报销对话框已能把文本、附件名称、OCR 摘要页面上下文和会话 ID 带入 Orchestrator并返回回答、规则引用、风险说明结构化草稿和右侧预审面板;个人工作台已支持“继续会话 / 新建会话”分流、恢复最近历史消息和显式清空旧会话,但附件 / OCR 结果落库及 `draft -> submitted` 仍未完成。
## Day 1 - Day 5 未完成补齐清单 ## Day 1 - Day 5 未完成补齐清单
- Day 1当前周计划范围内无新增遗留项基础资产、日志、审计和最小财务表已完成文件资产、OCR 结果表和风险事件表作为 Day 5 真落库前置底座,设计已完成但代码未落地。 - Day 1当前周计划范围内无新增遗留项基础资产、日志、审计和最小财务表已完成文件资产、OCR 结果表和风险事件表作为 Day 5 真落库前置底座,设计已完成但代码未落地。
- Day 2仍缺一轮浏览器人工走查记录需补充规则中心真实页面联调截图或缺陷清单。 - Day 2仍缺一轮浏览器人工走查记录需补充规则中心真实页面联调截图或缺陷清单。
- Day 3仍需补充叙述型报销长句样本、附件/OCR 摘要带入样本、模糊短句追问样本,并把这些样本纳入自动评测。 - Day 3仍需补充叙述型报销长句样本、附件/OCR 摘要带入样本、模糊短句追问样本,并把这些样本纳入自动评测。
- Day 4仍需接通 `update_expense_claim_draft` / `submit_expense_claim` 真服务补齐附件挂接服务注册、ToolCall 更细粒度记录和前端 Trace 展示。 - Day 4仍需接通 `submit_expense_claim` 真服务补齐附件挂接服务注册、ToolCall 更细粒度记录和前端 Trace 展示。
- Day 5仍需把附件和 OCR 识别结果真正落到 `document_assets``document_asset_versions``expense_item_documents``document_ocr_results`,并完成 `draft -> submitted` 状态流转、前端 claim/status 回显和提交流程确认。 - Day 5仍需把附件和 OCR 识别结果真正落到 `document_assets``document_asset_versions``expense_item_documents``document_ocr_results`,并完成 `draft -> submitted` 状态流转、前端确认动作回写和提交流程确认。
## 关键依赖顺序 ## 关键依赖顺序

View File

@@ -31,6 +31,7 @@ Orchestrator 不能直接根据原始文本做可靠路由。它需要先拿到
- [x] ~~`/api/v1/ontology/parse` 已上线8 字段语义结构、缺槽位、歧义、权限和澄清问题均可返回。~~ - [x] ~~`/api/v1/ontology/parse` 已上线8 字段语义结构、缺槽位、歧义、权限和澄清问题均可返回。~~
- [x] ~~语义层已切到“模型优先 + 规则回退”,并把结果写入 `AgentRun` / `SemanticParseLog`。~~ - [x] ~~语义层已切到“模型优先 + 规则回退”,并把结果写入 `AgentRun` / `SemanticParseLog`。~~
- [x] ~~附件名称、附件数量、OCR 摘要和 OCR 文档摘要已能作为上下文带入语义层。~~ - [x] ~~附件名称、附件数量、OCR 摘要和 OCR 文档摘要已能作为上下文带入语义层。~~
- [x] ~~最小会话历史、上一轮场景/意图和 `draft_claim_id` 已能作为上下文带入语义层,用于识别“改成 800”“继续补充”这类追问。~~
- [x] ~~前端调试入口与核心评测测试已完成并通过。~~ - [x] ~~前端调试入口与核心评测测试已完成并通过。~~
- [ ] 叙述型报销样本、附件/OCR 带入样本和模糊短句追问样本仍需继续扩充。 - [ ] 叙述型报销样本、附件/OCR 带入样本和模糊短句追问样本仍需继续扩充。

View File

@@ -26,7 +26,10 @@
- [x] ~~`/api/v1/orchestrator/run`、统一路由、权限阻断、ToolCall 记录、Trace 和降级结果已经可用。~~ - [x] ~~`/api/v1/orchestrator/run`、统一路由、权限阻断、ToolCall 记录、Trace 和降级结果已经可用。~~
- [x] ~~用户消息已能路由到 User Agent占位 Hermes 任务也能由定时入口触发。~~ - [x] ~~用户消息已能路由到 User Agent占位 Hermes 任务也能由定时入口触发。~~
- [x] ~~附件名称、页面上下文和 OCR 摘要已能随 Orchestrator 请求透传到语义层和 User Agent。~~ - [x] ~~附件名称、页面上下文和 OCR 摘要已能随 Orchestrator 请求透传到语义层和 User Agent。~~
- [ ] 真实 `expense_claims` 改单 / 提交链路尚未接通;草稿建单已接到真实落库,附件与 OCR 持久化仍未完成。 - [x] ~~Orchestrator 已开始向前端返回结构化 `review_payload`,用于右侧预审面板展示识别意图、槽位、票据和分单建议。~~
- [x] ~~`conversation_id`、会话消息历史和 `draft_claim_id` 已接入 Orchestrator会话内追问可继续落到同一张报销草稿。~~
- [x] ~~已新增最近会话恢复与用户级会话清空接口,个人工作台可显式继续旧会话或删除旧会话后新建。~~
- [ ] 真实 `expense_claims` 提交链路尚未接通;草稿建单 / 改单已接到真实落库,附件与 OCR 持久化仍未完成。
- [ ] 报销附件持久化服务、OCR 结果落库服务和前端 ToolCall 细粒度 Trace 展示尚未接通。 - [ ] 报销附件持久化服务、OCR 结果落库服务和前端 ToolCall 细粒度 Trace 展示尚未接通。
相关架构文档: 相关架构文档:
@@ -114,7 +117,7 @@
- [x] ~~`intent=explain` 路由到 User Agent。~~ - [x] ~~`intent=explain` 路由到 User Agent。~~
- [x] ~~`intent=draft` 路由到 User Agent但当前只返回草稿占位结果。~~ - [x] ~~`intent=draft` 路由到 User Agent但当前只返回草稿占位结果。~~
- [x] ~~`scenario=expense` 且最小建单槽位完整时,允许进入 `create_expense_claim_draft`。~~ - [x] ~~`scenario=expense` 且最小建单槽位完整时,允许进入 `create_expense_claim_draft`。~~
- [ ] `scenario=expense` 且已有 `claim_id` 时,允许进入 `update_expense_claim_draft` - [x] ~~`scenario=expense` 且已有 `claim_id` 或会话内 `draft_claim_id` 时,允许进入 `update_expense_claim_draft`。~~
- [ ] `scenario=expense` 且用户明确确认提交时,允许进入 `submit_expense_claim` - [ ] `scenario=expense` 且用户明确确认提交时,允许进入 `submit_expense_claim`
- [x] ~~`permission.level=approval_required` 时设置 `requires_confirmation=true`。~~ - [x] ~~`permission.level=approval_required` 时设置 `requires_confirmation=true`。~~
- [x] ~~`permission.level=forbidden` 时不调用下游 Agent。~~ - [x] ~~`permission.level=forbidden` 时不调用下游 Agent。~~
@@ -185,6 +188,7 @@
- [x] ~~响应返回权限结果。~~ - [x] ~~响应返回权限结果。~~
- [x] ~~复用 `GET /api/v1/agent-runs/{run_id}` 查看 Trace。~~ - [x] ~~复用 `GET /api/v1/agent-runs/{run_id}` 查看 Trace。~~
- [x] ~~Trace 接口返回语义解析、路由、工具调用、最终结果。~~ - [x] ~~Trace 接口返回语义解析、路由、工具调用、最终结果。~~
- [x] ~~`POST /api/v1/orchestrator/run` 返回的 `result` 已可携带 `review_payload`。~~
验收证据: 验收证据:
@@ -210,7 +214,8 @@
- [x] ~~测试用户查询路由到 User Agent。~~ - [x] ~~测试用户查询路由到 User Agent。~~
- [x] ~~测试定时任务路由到 Hermes。~~ - [x] ~~测试定时任务路由到 Hermes。~~
- [ ] 测试叙述型报销输入可路由到报销建单服务。 - [x] ~~测试叙述型报销输入可路由到报销建单服务。~~
- [x] ~~测试同一 `conversation_id` 下的追问会继续更新已有报销草稿。~~
- [ ] 测试报销单提交前必须显式确认。 - [ ] 测试报销单提交前必须显式确认。
- [x] ~~测试 forbidden 不调用下游 Agent。~~ - [x] ~~测试 forbidden 不调用下游 Agent。~~
- [x] ~~测试 approval_required 返回确认。~~ - [x] ~~测试 approval_required 返回确认。~~
@@ -227,7 +232,7 @@
- [x] ~~用户请求能路由到 User Agent 占位实现。~~ - [x] ~~用户请求能路由到 User Agent 占位实现。~~
- [x] ~~定时任务能路由到 Hermes 占位实现。~~ - [x] ~~定时任务能路由到 Hermes 占位实现。~~
- [x] ~~语义补槽完成后的报销输入能路由到建单动作。~~ - [x] ~~语义补槽完成后的报销输入能路由到建单动作。~~
- [ ] 语义补槽完成后的报销输入能路由到改单动作。 - [x] ~~语义补槽完成后的报销输入能路由到改单动作。~~
- [x] ~~权限阻断有效。~~ - [x] ~~权限阻断有效。~~
- [x] ~~运行 Trace 可查询。~~ - [x] ~~运行 Trace 可查询。~~
- [x] ~~工具调用日志可查询。~~ - [x] ~~工具调用日志可查询。~~
@@ -243,4 +248,5 @@
- [x] ~~当前路由规则已稳定为:`user_message -> user_agent`、`schedule -> hermes`、`clarification_required -> blocked`。~~ - [x] ~~当前路由规则已稳定为:`user_message -> user_agent`、`schedule -> hermes`、`clarification_required -> blocked`。~~
- [x] ~~当前权限判断已稳定为:`read / draft_write / approval_required / forbidden`,高风险动作默认阻断或要求确认。~~ - [x] ~~当前权限判断已稳定为:`read / draft_write / approval_required / forbidden`,高风险动作默认阻断或要求确认。~~
- [x] ~~Day 5 需承接的接口契约已明确Orchestrator 向 User Agent 传入语义结果、能力码、工具结果,并期待返回 `answer / citations / suggested_actions / draft_payload / risk_flags`。~~ - [x] ~~Day 5 需承接的接口契约已明确Orchestrator 向 User Agent 传入语义结果、能力码、工具结果,并期待返回 `answer / citations / suggested_actions / draft_payload / risk_flags`。~~
- [x] ~~下一步仍需补齐的运行时写链路是报销草稿真实落库、附件持久化、OCR 结果落库和提交状态流转。~~ - [x] ~~Day 5 当前已扩展接口契约:除 `answer / citations / suggested_actions / draft_payload / risk_flags` 外,还返回 `review_payload` 用于前端预审工作台。~~
- [x] ~~下一步仍需补齐的运行时写链路是附件持久化、OCR 结果落库和提交状态流转。~~

View File

@@ -32,6 +32,8 @@ Day 1 到 Day 4 已经具备资产、语义、路由和日志基础,此时可
- [x] ~~个人工作台、报销对话框和通用聊天入口已经接通真实 Orchestrator / User Agent 问答链路。~~ - [x] ~~个人工作台、报销对话框和通用聊天入口已经接通真实 Orchestrator / User Agent 问答链路。~~
- [x] ~~回答、规则引用、风险说明、建议动作和结构化 `draft_payload` 已可返回。~~ - [x] ~~回答、规则引用、风险说明、建议动作和结构化 `draft_payload` 已可返回。~~
- [x] ~~报销对话框已接入 OCR 识别接口附件名称、OCR 摘要和页面上下文已能透传到 Orchestrator / User Agent。~~ - [x] ~~报销对话框已接入 OCR 识别接口附件名称、OCR 摘要和页面上下文已能透传到 Orchestrator / User Agent。~~
- [x] ~~右侧工作台已开始展示结构化 `review_payload`:识别意图、待确认字段、历史风险/注意事项、分单建议、逐票据识别结果和确认动作卡片。~~
- [x] ~~个人工作台和报销对话框已接入 `conversation_id` / `draft_claim_id`,同一会话内的连续追问不再按全新请求处理。~~
- [ ] 真实 `document_assets` / `document_asset_versions` / `expense_item_documents` / `document_ocr_results` 落库,以及 `draft -> submitted` 状态流转尚未完成;`expense_claims` / `expense_claim_items` 草稿已接通真实落库。 - [ ] 真实 `document_assets` / `document_asset_versions` / `expense_item_documents` / `document_ocr_results` 落库,以及 `draft -> submitted` 状态流转尚未完成;`expense_claims` / `expense_claim_items` 草稿已接通真实落库。
相关架构文档: 相关架构文档:
@@ -151,7 +153,7 @@ Day 1 到 Day 4 已经具备资产、语义、路由和日志基础,此时可
- [x] ~~支持根据语义结果创建或更新 `expense_claim_items`。~~ - [x] ~~支持根据语义结果创建或更新 `expense_claim_items`。~~
- [ ] 支持把用户上传附件挂到 `document_assets``document_asset_versions``expense_item_documents` - [ ] 支持把用户上传附件挂到 `document_assets``document_asset_versions``expense_item_documents`
- [ ] 支持把 OCR 识别快照写入 `document_ocr_results`,并保留 `ocr_engine``ocr_model``raw_json``confidence` - [ ] 支持把 OCR 识别快照写入 `document_ocr_results`,并保留 `ocr_engine``ocr_model``raw_json``confidence`
- [ ] 对话中补充金额、事由、客户、参与人、票据后,能回写已有草稿而不是只更新内存结果。 - [x] ~~对话中补充金额、发生时间、费用类型等已落地字段后,能回写已有草稿而不是只更新内存结果。~~
- [x] ~~支持生成报销处理意见草稿。~~ - [x] ~~支持生成报销处理意见草稿。~~
- [x] ~~支持生成应收催收建议草稿。~~ - [x] ~~支持生成应收催收建议草稿。~~
- [x] ~~支持生成应付付款建议草稿。~~ - [x] ~~支持生成应付付款建议草稿。~~
@@ -195,10 +197,14 @@ Day 1 到 Day 4 已经具备资产、语义、路由和日志基础,此时可
- [x] ~~提交时透传附件名称。~~ - [x] ~~提交时透传附件名称。~~
- [x] ~~提交时透传 OCR 摘要。~~ - [x] ~~提交时透传 OCR 摘要。~~
- [x] ~~提交时透传页面上下文。~~ - [x] ~~提交时透传页面上下文。~~
- [x] ~~提交时透传 `conversation_id` 与 `draft_claim_id`。~~
- [ ] 提交时透传附件 ID。 - [ ] 提交时透传附件 ID。
- [x] ~~展示 Agent 回答。~~ - [x] ~~展示 Agent 回答。~~
- [x] ~~展示引用规则或知识。~~ - [x] ~~展示引用规则或知识。~~
- [x] ~~展示建议动作。~~ - [x] ~~展示建议动作。~~
- [x] ~~展示识别意图摘要、待确认字段和确认动作卡片。~~
- [x] ~~展示逐票据 OCR 识别结果,并支持按 1、2、3… 顺序查看。~~
- [x] ~~展示多场景票据的分单建议。~~
- [ ] 展示报销草稿 ID 或 claim_no。 - [ ] 展示报销草稿 ID 或 claim_no。
- [ ] 展示当前报销状态。 - [ ] 展示当前报销状态。
- [x] ~~展示需要人工确认的提示。~~ - [x] ~~展示需要人工确认的提示。~~
@@ -237,7 +243,7 @@ Day 1 到 Day 4 已经具备资产、语义、路由和日志基础,此时可
- [x] ~~测试风险解释。~~ - [x] ~~测试风险解释。~~
- [ ] 测试 OCR 摘要透传后User Agent 能在回答中正确引用附件语境而不编造内容。 - [ ] 测试 OCR 摘要透传后User Agent 能在回答中正确引用附件语境而不编造内容。
- [x] ~~测试报销草稿创建。~~ - [x] ~~测试报销草稿创建。~~
- [ ] 测试报销草稿补槽更新。 - [x] ~~测试报销草稿补槽更新。~~
- [ ] 测试报销状态从 `draft` 变更到 `submitted` - [ ] 测试报销状态从 `draft` 变更到 `submitted`
- [x] ~~测试草稿生成。~~ - [x] ~~测试草稿生成。~~
- [ ] 测试越权动作阻断。 - [ ] 测试越权动作阻断。
@@ -268,5 +274,6 @@ Day 1 到 Day 4 已经具备资产、语义、路由和日志基础,此时可
- [x] ~~当前已支持报销 / 应收 / 应付查询、规则解释、风险解释、草稿建议与澄清追问。~~ - [x] ~~当前已支持报销 / 应收 / 应付查询、规则解释、风险解释、草稿建议与澄清追问。~~
- [x] ~~当前已支持附件名称、OCR 摘要和页面上下文进入对话链路,但这还不是附件真实持久化。~~ - [x] ~~当前已支持附件名称、OCR 摘要和页面上下文进入对话链路,但这还不是附件真实持久化。~~
- [x] ~~当前已把用户一句话和多票据输入转成结构化预审面板,开始支持字段确认、票据核对和分单建议,而不再只是返回一段文本。~~
- [x] ~~当前仍是占位的主要能力是报销单真实落库、附件持久化、OCR 结果入表和知识库读取,不再是简单静态问答 Mock。~~ - [x] ~~当前仍是占位的主要能力是报销单真实落库、附件持久化、OCR 结果入表和知识库读取,不再是简单静态问答 Mock。~~
- [x] ~~Day 6 Hermes 可直接复用当前的规则检查、风险标签和 Orchestrator Trace / ToolCall 契约。~~ - [x] ~~Day 6 Hermes 可直接复用当前的规则检查、风险标签和 Orchestrator Trace / ToolCall 契约。~~