Files
X-Financial/document/development/数字员工能力库扩展/CONCEPT.md

134 lines
7.6 KiB
Markdown
Raw Normal View History

# 数字员工能力库扩展概念文档
更新日期2026-05-31
## 功能一句话
把数字员工从少量后台任务扩展为覆盖事实抽取、规则命中分析、资产积累、报告生成和人工复核辅助的企业级后台分析能力库。
## 背景与问题
当前员工技能数量偏少,只有制度整理、风险图谱巡检、员工画像巡检和少量复核辅助能力。页面观感更像技术演示,不像完整的财务数字员工能力矩阵。
需要把已有风险图谱、制度知识、画像基线、反馈池、回放评测等算法资产拆成用户能理解的员工技能,让列表规模、分类结构和详情内容都更完整。
同时必须收敛数字员工边界:数字员工不是风险专家,也不是规则制定者。风险口径、规则内容、制度解释和最终判断由人负责;规则中心执行归属外层智能体流程,数字员工只负责读取事实、规则命中和反馈结果,生成后台分析、报告、知识库材料和待人工复核线索。
## 目标
- 员工技能数量扩展到不少于 16 个。
- 保持四类技能:积累、升级、整理、评估。
- 每个技能都有名称、描述、技能包、分类、执行场景、输入、输出、是否定时、是否写入工作记录。
- 新增技能进入资产种子和运行时补齐逻辑,已有数据库启动后也能自动补齐。
- 新增技能包落在 `server/src/app/skills/domain`,便于后续同步到数字员工运行侧。
- 明确技能边界:输出事实、规则命中和待人工确认线索,不输出正式规则结论或规则变更裁判。
## 非目标
- 本轮不引入新的数据库结构变更。
- 本轮不要求所有新增技能都接入真实执行器。
- 本轮不复制竞品术语或页面包装,只做 X-Financial 自有能力命名。
- 本轮不让数字员工总结风险规则、发明新规则、修改规则中心或替代人工确认风险。
## 用户与场景
- 风控管理员:查看评估类和升级类技能,理解规则命中分析、异常线索、人工复核样本和回放评测能力。
- 财务制度管理员:查看整理类技能,维护制度条款、政策口径和规则命中样本。
- 数据治理人员:查看积累类技能,理解员工、部门、供应商和反馈样本如何沉淀。
- 系统管理员:配置定时计划、查看工作记录和执行结果。
## 功能能力
完整员工技能库按四类组织:
- 整理:财务制度、制度条款、政策口径、规则命中样本。
- 积累:员工画像、部门基线、供应商画像、误报样本、反馈样本。
- 评估:风险图谱、多凭证一致性、时空一致性、预算超标、供应商异常关系。
- 升级:风险线索归集、算法回放、制度引用缺口提示和人工复核材料整理。
每个技能需要提供:
- `skill_name`:技能包目录名。
- `skill_category`:积累、升级、整理、评估之一。
- `task_type`:由任务 code 派生。
- `schedule` / `cron_expression`:默认定时计划。
- `input_sources`:输入来源。
- `output_format`:产出格式。
- `writes_work_record`:是否产出工作记录。
- `execution_strategy`:真实执行、复用现有扫描器或定义先行。
- `role_boundary`:规则由人定义、风险由人确认、主流程由外层智能体执行,数字员工只做后台分析、报告生成和知识沉淀。
- `allowed_outputs`:只允许输出 `facts``rule_hits``risk_clues``evidence_refs``human_review_required` 等受控字段。
## 数字员工边界
数字员工允许做三件事:
- 事实抽取:从申请单、报销单、票据、附件、审批记录中抽取金额、时间、地点、人员、供应商、票据号、申请关系等事实。
- 规则命中分析:读取外层智能体流程已经产生的规则命中结果、字段依据和原始证据,用于后台报告与复核材料整理。
- 线索归集:基于事实和规则命中输出“待人工复核”的潜在线索,不能把线索升级为正式风险结论。
数字员工禁止做四件事:
- 不总结或发明风险规则。
- 不修改、发布、删除规则中心规则。
- 不把潜在线索判定为最终违规结论。
- 不替代财务、风控或管理员进行制度解释和风险确认。
## 方案设计
### 后端
-`agent_foundation_constants.py` 增加新增任务 code 和分类映射。
-`agent_foundation_digital_employee_tasks.py` 增加运行时任务规格。
- 在初始种子流程完成基础任务 flush 后,调用运行时补齐逻辑,保证新库完整落库。
- 新增技能包目录和 `SKILL.md`,内容包含功能说明、执行时机、输入输出和边界。
- 将容易越权的“规则发现、规则模板整理、制度缺口优化”收敛为“风险线索归集、规则命中样本整理、制度引用缺口提示”。
### 前端
前端列表已按资产接口读取任务类资产,不需要新增页面结构。新增任务落库后会自动进入员工技能列表,并使用已有筛选、分类和详情展示。
### 算法与公式
本轮主要扩展能力目录和角色边界,不新增评分公式。后续每个技能接入真实算法时,再在对应算法文档中补充公式。
数字员工输出的线索置信度只能作为排序依据,不能作为最终风险裁判:
$$
risk\_clue = f(facts, rule\_hits, evidence\_quality)
$$
其中 `facts` 来自申请与报销事实,`rule_hits` 来自外层智能体流程或规则中心已经产生的命中结果,`evidence_quality` 表示证据完整度。数字员工不触发规则主流程,最终是否构成风险由人工复核或规则中心既有处置流程决定。
### 后台分析闭环
风险线索归集不是规则生产流程,而是后台分析闭环的一环:
- 工作记录详情展示本次归集的事实、规则命中、待复核线索和近期反馈样本。
- 风险看板展示待复核线索数和反馈样本数,用于观察后台分析是否形成可复盘资产。
- 人工反馈仍写入风险观察反馈池,数字员工只读取反馈池做线索排序、复核材料整理和后续报告生成。
## 测试方案
- 单元测试:校验数字员工运行时任务规格数量、分类覆盖、技能包目录存在、任务 code 唯一。
- 配置测试:校验每个任务配置都包含 `skill_name``output_format``skill_category_options`
- 容器验证:在 `x-financial-main:/app/server` 运行定向测试。
- 手工验收:进入数字员工员工技能列表,确认技能数量和分类明显完整。
- 接口验收:风险看板接口返回 `risk_clue_count``feedback_sample_count`,工作记录详情能展示风险线索归集的反馈样本摘要。
## 指标与验收
- 员工技能总数不少于 17 个。
- 四类分类都有技能。
- 新增技能包全部存在 `SKILL.md`
- 定向测试通过。
- 风险看板不再展示候选规则指标,改为待复核线索和反馈样本。
- 不引入数据库迁移和破坏性变更。
## 风险与开放问题
- 新增技能中部分为“定义先行”,立即运行时需要后续逐步接入真实执行器。
- 如果用户希望每个技能都能立即产出真实结果,需要继续拆分执行服务和工作记录产物。
- 已接入风险线索归集真实执行器,后续应继续把多凭证、时空、预算、供应商异常从风险图谱主引擎中拆成独立算法模块。
- 若技能命名或说明再次出现“数字员工承担规则主流程、规则发现、规则优化、自动总结风险”等表述,应优先改为读取规则命中结果、事实、线索、复核材料等受控表述。