113 lines
5.3 KiB
Markdown
113 lines
5.3 KiB
Markdown
|
|
# 风险图谱数据来源与壁垒资产清单
|
|||
|
|
|
|||
|
|
更新日期:2026-05-30
|
|||
|
|
|
|||
|
|
## 风险相关数据来源
|
|||
|
|
|
|||
|
|
1. 报销单主表:`ExpenseClaim`
|
|||
|
|
- 关键字段:`id`、`claim_no`、`employee_id`、`employee_name`、`department_id`、`department_name`、`expense_type`、`amount`、`currency`、`invoice_count`、`occurred_at`、`submitted_at`、`status`、`approval_stage`、`risk_flags_json`。
|
|||
|
|
- 用途:风险主体、金额基线、流程阶段、规则命中、图谱 claim 节点。
|
|||
|
|
|
|||
|
|
2. 报销明细:`ExpenseClaimItem`
|
|||
|
|
- 关键字段:`item_id`、`item_type`、`item_amount`、`item_location`、`item_date`、`invoice_id`。
|
|||
|
|
- 用途:多凭证一致性、时空一致性、票据关系、图谱 item / invoice 节点。
|
|||
|
|
|
|||
|
|
3. 风险规则命中:`risk_flags_json` 与规则中心结果
|
|||
|
|
- 来源:报销单已有风险标记、`RiskObservationService.upsert_platform_risk_flags()`。
|
|||
|
|
- 用途:`S_rule`、规则版本追溯、候选规则闭环。
|
|||
|
|
|
|||
|
|
4. 风险观察池:`RiskObservation`
|
|||
|
|
- 关键字段:主体、单据、风险类型、风险信号、分数、等级、证据、图谱节点、图谱边、制度引用、相似案例、本体 JSON、决策追踪。
|
|||
|
|
- 用途:统一风险结论、看板、详情、反馈、回放。
|
|||
|
|
|
|||
|
|
5. 风险观察反馈:`RiskObservationFeedback`
|
|||
|
|
- 关键字段:反馈类型、动作、处理人、备注、扩展 payload。
|
|||
|
|
- 用途:人工采纳、误报、忽略、处理完成、候选规则来源、回放标签。
|
|||
|
|
|
|||
|
|
6. 数字员工任务记录:`HermesTaskExecutionLog`
|
|||
|
|
- 关键字段:任务配置、状态、开始结束时间、错误信息、执行摘要。
|
|||
|
|
- 用途:风险扫描任务追溯、数字员工工作记录详情、失败原因。
|
|||
|
|
|
|||
|
|
7. Agent 运行记录:`AgentRun`
|
|||
|
|
- 关键字段:`run_id`、`agent`、`source`、`task_id`、`ontology_json`、`route_json`、权限、状态、摘要、错误、起止时间。
|
|||
|
|
- 用途:数字员工运行上下文、数据血缘、回放输入。
|
|||
|
|
|
|||
|
|
8. 工具调用记录:`AgentToolCall`
|
|||
|
|
- 关键字段:工具类型、工具名称、请求、响应、状态、耗时、错误。
|
|||
|
|
- 用途:OCR、知识检索、规则执行、外部工具证据链。
|
|||
|
|
|
|||
|
|
9. 语义解析日志:`SemanticParseLog`
|
|||
|
|
- 关键字段:原始查询、场景、意图、实体、时间范围、指标、约束、风险信号、权限、置信度。
|
|||
|
|
- 用途:本体到风险图谱桥接、低置信度降级、语义血缘。
|
|||
|
|
|
|||
|
|
10. 财务制度知识库
|
|||
|
|
- 来源:知识库文档、制度归集任务、知识检索证据。
|
|||
|
|
- 用途:制度条款引用、`S_policy`、风险解释、制度缺口识别。
|
|||
|
|
|
|||
|
|
## `/api/v1/ontology/parse` 字段与落库方式
|
|||
|
|
|
|||
|
|
接口请求:`OntologyParseRequest`
|
|||
|
|
|
|||
|
|
- `query`:自然语言问题。
|
|||
|
|
- `user_id`:当前用户。
|
|||
|
|
- `context_json`:角色、部门、权限上下文。
|
|||
|
|
|
|||
|
|
接口响应:`OntologyParseResult`
|
|||
|
|
|
|||
|
|
- `scenario`:业务场景。
|
|||
|
|
- `intent`:用户意图。
|
|||
|
|
- `entities`:实体列表,包含类型、原值、标准值、角色、置信度。
|
|||
|
|
- `time_range`:时间范围。
|
|||
|
|
- `metrics`:指标列表。
|
|||
|
|
- `constraints`:字段约束。
|
|||
|
|
- `risk_flags`:风险信号列表。
|
|||
|
|
- `permission`:权限结果。
|
|||
|
|
- `confidence`:整体置信度。
|
|||
|
|
- `missing_slots`:缺失槽位。
|
|||
|
|
- `ambiguity`:歧义说明。
|
|||
|
|
- `parse_strategy`:解析策略。
|
|||
|
|
- `clarification_required` / `clarification_question`:是否需要追问。
|
|||
|
|
- `run_id`:关联 `AgentRun.run_id`。
|
|||
|
|
- `field_errors`:字段级错误。
|
|||
|
|
|
|||
|
|
落库方式:
|
|||
|
|
|
|||
|
|
- `AgentRun.ontology_json` 保存本次解析概要。
|
|||
|
|
- `SemanticParseLog.entities_json` 保存实体。
|
|||
|
|
- `SemanticParseLog.time_range_json` 保存时间。
|
|||
|
|
- `SemanticParseLog.metrics_json` 保存指标。
|
|||
|
|
- `SemanticParseLog.constraints_json` 保存约束。
|
|||
|
|
- `SemanticParseLog.risk_flags_json` 保存风险信号。
|
|||
|
|
- `SemanticParseLog.permission_json` 保存权限。
|
|||
|
|
- `SemanticParseLog.confidence` 保存整体置信度。
|
|||
|
|
|
|||
|
|
## 不可复制壁垒资产
|
|||
|
|
|
|||
|
|
1. 专有财务本体
|
|||
|
|
- 由场景、意图、实体、约束、风险信号、权限和置信度构成。
|
|||
|
|
- 价值:把自然语言、规则中心和风险图谱统一到同一业务语义。
|
|||
|
|
|
|||
|
|
2. 对象中心财务事件日志
|
|||
|
|
- 由 `ObjectCentricEvent` 承载,统一申请、报销、票据、审批、退回、付款、归档、复盘。
|
|||
|
|
- 价值:形成可回放过程挖掘资产。
|
|||
|
|
|
|||
|
|
3. 风险观察反馈池
|
|||
|
|
- 由 `RiskObservationFeedback` 承载,记录确认、误报、忽略、改写、补件、升级和候选规则来源。
|
|||
|
|
- 价值:把人工判断变成模型和规则迭代样本。
|
|||
|
|
|
|||
|
|
4. 人机共审行为数据
|
|||
|
|
- 来源:AgentRun、ToolCall、反馈、数字员工执行日志。
|
|||
|
|
- 价值:记录谁在何时基于什么证据做了什么判断。
|
|||
|
|
|
|||
|
|
5. 可回放评测资产
|
|||
|
|
- 由 `AlgorithmReplaySet` 与 `RiskEvaluationCase` 承载。
|
|||
|
|
- 价值:每次规则、本体或算法升级后都能复跑历史样本,防止误报率失控。
|
|||
|
|
|
|||
|
|
6. 实体标准化资产
|
|||
|
|
- 由 `FinancialEntityResolver` 和 `CanonicalEntityRegistry` 承载。
|
|||
|
|
- 价值:沉淀供应商、商户、酒店、银行户名、员工姓名等标准主体。
|
|||
|
|
|
|||
|
|
7. 可解释决策资产
|
|||
|
|
- 由 `DecisionTrace`、贡献项、不确定性原因、数据血缘承载。
|
|||
|
|
- 价值:让每个风险结论都能被审计、复核和反事实推演。
|