- 新增 25+ 条风险规则(预算/报销/申请/通用类),完善风险规则模拟与反馈发布机制 - 引入费用审批动态路由、平台风险分级、预审与风险阶段管理 - 预算中心列表化改造,优化票据夹仪表盘与数字员工工作看板 - 新增 Hermes 风险线索收集器、Agent 链路追踪中心 - 扩展数字员工能力库(18 个领域 Skill)与交通费用自动预估 - 完善报销申请快速预览、权限控制与前端测试覆盖
7.9 KiB
7.9 KiB
数字员工能力库扩展 TODO
更新日期:2026-05-31
1. 调研与契约
- 复核当前员工技能数量、分类和技能包目录。[CONCEPT: 背景与问题] 证据:当前已有基础技能包:制度整理、风险图谱巡检、员工画像巡检、风险线索归集。
- 定义完整能力矩阵,覆盖积累、升级、整理、评估四类。[CONCEPT: 功能能力] 证据:
CONCEPT.md已列出 17 个目标技能。
2. 后端资产
- 增加新增数字员工任务 code 和分类映射。[CONCEPT: 后端] 证据:
agent_foundation_constants.py已新增 13 个任务 code,DIGITAL_EMPLOYEE_TASK_CATEGORY_MAP覆盖四类分类。 - 增加运行时任务规格,保证已有数据库可自动补齐新增员工技能。[CONCEPT: 后端] 证据:
agent_foundation_digital_employee_tasks.py已扩展到 16 个运行时任务规格,新增技能均包含skill_name/input_sources/output_format/execution_strategy。 - 调整初始种子流程,保证空库初始化时也能落齐完整员工技能库。[CONCEPT: 后端] 证据:
agent_foundation_asset_seed.py在基础资产flush后调用_upsert_runtime_digital_employee_tasks(),空库初始化会补齐完整运行时技能。
3. 技能包
- 新增制度条款、政策口径、规则命中样本等整理类技能包。[CONCEPT: 功能能力] 证据:已新增
finance-policy-clause-extractor、expense-policy-alignment、rule-execution-case-organizer技能包。 - 新增部门基线、供应商画像、误报样本、反馈样本等积累类技能包。[CONCEPT: 功能能力] 证据:已新增
department-expense-baseline-accumulator、supplier-risk-profile-accumulator、false-positive-sample-accumulator、risk-feedback-sample-accumulator技能包。 - 新增多凭证、时空、预算、供应商关系等评估类技能包。[CONCEPT: 功能能力] 证据:已新增
multi-evidence-consistency-evaluator、travel-spatiotemporal-consistency-evaluator、budget-overrun-precontrol-evaluator、supplier-abnormal-relation-evaluator技能包。 - 新增回放评测、制度引用缺口提示等升级类技能包。[CONCEPT: 功能能力] 证据:已新增
risk-algorithm-replay-evaluator、policy-reference-gap-hinter技能包。
4. 测试与验收
- 增加数字员工技能目录测试,校验任务 code 唯一、分类覆盖、技能包存在。[CONCEPT: 测试方案] 证据:新增
tests/test_digital_employee_skill_catalog.py覆盖任务数量、分类、配置和技能包。 - 在 Docker 容器
x-financial-main:/app运行定向测试,60s 内完成。[CONCEPT: 测试方案] 证据:docker exec x-financial-main bash -lc "cd /app && timeout 60s /tmp/x-financial-server-venv/bin/python -m pytest server/tests/test_digital_employee_skill_catalog.py -q"通过,3 个测试通过。 - 确认最终员工技能总数不少于 17 个,四类分类都有技能。[CONCEPT: 指标与验收] 证据:测试断言运行时 16 个技能加
整理公司财务知识制度共 17 个,分类覆盖积累、升级、整理、评估。
5. 边界收敛
- 调整概念文档,明确数字员工不总结风险规则、不发明规则、不替代人工确认风险。[CONCEPT: 数字员工边界] 证据:
CONCEPT.md和hermes-risk-graph-algorithm/CONCEPT.md已把数字员工边界收敛为事实抽取、规则命中结果读取、后台分析和待复核线索归集。 - 将“风险规则候选发现、风险规则模板整理、制度缺口与规则变更建议”收敛为事实、规则命中和人工复核辅助类技能。[CONCEPT: 功能能力] 证据:运行时技能已改为
risk-clue-collector、rule-execution-case-organizer、policy-reference-gap-hinter。 - 在技能配置中增加
role_boundary和allowed_outputs,约束输出只能是事实、规则命中、线索和证据引用。[CONCEPT: 数字员工边界] 证据:agent_foundation_digital_employee_tasks.py为运行时技能配置写入role_boundary、allowed_outputs和writes_rules=false。 - 更新技能包 Markdown,禁止数字员工发布、改写、总结规则,风险线索必须待人工复核。[CONCEPT: 后端] 证据:
risk-clue-collector、rule-execution-case-organizer、policy-reference-gap-hinter及兼容别名技能包均已声明禁止生成、改写或发布规则。 - 增加目录测试,防止数字员工技能重新出现自动发布、规则变更、候选规则生成等越权语义。[CONCEPT: 测试方案] 证据:
test_digital_employee_skills_do_not_cross_rule_governance_boundary已断言旧技能名和危险输出格式不再进入数字员工目录。
7. 流程边界收敛
- 明确规则中心命中结果归属外层智能体流程,数字员工只消费规则命中结果。[CONCEPT: 数字员工边界] 证据:
CONCEPT.md已改为“规则命中分析”,并声明数字员工不触发规则主流程。 - 更新技能与配置文案,禁止数字员工被描述为规则主流程处理器。[CONCEPT: 后端] 证据:
agent_foundation_digital_employee_tasks.py、risk-clue-collector、rule-execution-case-organizer及兼容别名技能包均已改为后台分析和复核材料口径。 - 增加测试,防止
role_boundary再次出现规则主流程越界表述。[CONCEPT: 测试方案] 证据:test_digital_employee_runtime_specs_build_display_ready_config已覆盖主流程归属和禁止数字员工承担规则主流程职责。
6. 风险线索归集真实执行器
- 新增
HermesRiskClueCollectorService,读取申请/报销事实、规则命中、风险观察和人工反馈,输出risk_clue_review_packet。[CONCEPT: 算法与公式] 证据:hermes_risk_clue_collector.py输出facts/rule_hits/risk_clues/evidence_refs/human_review_required。 - 将
risk_clue_collect接入数字员工立即运行分发。[CONCEPT: 后端] 证据:orchestrator_execution.py已新增digital_employee.risk_clue.collect工具调用,test_schedule_digital_employee_task_runs_real_service覆盖分发。 - 将
risk_clue_collect接入 Hermes 定时调度。[CONCEPT: 后端] 证据:hermes_scheduler.py已新增risk_clue_collect分支并写入执行摘要。 - 工作记录详情识别风险线索归集产物,展示事实、规则命中、待复核线索和证据引用计数。[CONCEPT: 前端] 证据:
digitalEmployeeWorkRecordsModel.js和DigitalEmployeeRunProducts.vue已支持risk_clue产物,前端测试覆盖。 - 增加执行器测试,验证不写规则、不输出候选规则、线索必须待人工复核。[CONCEPT: 测试方案] 证据:
test_hermes_risk_clue_collector.py通过,断言writes_rules=false、human_review_required=true和无candidate_risk_rules/auto_publish。
8. 后台分析闭环
- 风险线索归集产物补充观察键、反馈状态和近期反馈样本摘要,方便工作记录详情定位复核上下文。[CONCEPT: 后台分析闭环] 证据:
hermes_risk_clue_collector.py输出observation_key/feedback_status/next_action/feedback_summary,DigitalEmployeeRunProducts.vue展示反馈样本。 - 风险看板聚合接口补充
risk_clue_count与feedback_sample_count,把数字员工后台分析结果接入看板指标。[CONCEPT: 后台分析闭环] 证据:RiskObservationDashboardRead与RiskObservationService.summarize_dashboard()已输出线索数和反馈样本数。 - 风险看板前端移除“候选规则”指标,改为“待复核线索”和“反馈样本”。[CONCEPT: 指标与验收] 证据:
RiskObservationDashboard.vue的算法闭环效果区已展示待复核线索/反馈样本,前端测试断言不再出现候选规则。 - 增加后端与前端定向测试,并在 Docker 容器内验证核心后端测试通过。[CONCEPT: 测试方案] 证据:
pytest定向测试 8 个通过,node --test前端定向测试 8 个通过。