# 员工业务行为画像模型方案

## 目标

员工业务行为画像用于把费用申请、审批流转、AI 协作和数字员工巡检中产生的行为数据沉淀为可解释的统计画像。

它不是给员工贴负面标签，也不是替代审批人做最终判断，而是为以下场景提供结构化依据：

- 费用审批详情页展示申请人近期费用节奏和材料质量。
- Hermes 数字员工定期巡检高频费用、异常预算占用和流程质量问题。
- 运营看板观察 AI 使用、Token 消耗、流程耗时和审核效率。
- 后续规则中心根据真实覆盖率和人工覆盖情况优化规则阈值。

## 设计原则

1. 不把不同性质的数据混成一个总分。
2. 费用风险、流程质量、AI 使用、审批行为必须分维度计算。
3. 画像结果必须能追溯到指标、窗口期、同组基准和计算时间。
4. Hermes 负责调度和沉淀快照，确定性算法负责计算，LLM 只可用于解释和报告。
5. 画像用于审批参考和运营治理，不直接作为惩罚或自动降标依据。

## 画像分层

```text
员工业务行为画像
├── 费用支出画像
├── 流程质量画像
├── AI 协作画像
└── 审批行为画像
```

### 费用支出画像

用于判断申请人的费用节奏是否显著高于同组基准。

核心指标：

- 近 30 / 90 / 180 天申请次数。
- 近 30 / 90 / 180 天申请金额。
- 差旅申请次数、出差天数、日均费用。
- 招待申请次数、人均招待金额、同客户重复招待次数。
- 个人费用占部门预算比例。
- 个人费用占项目预算比例。
- 同部门、同岗位、同费用类型分位数。
- 历史调减、退回、复核次数。

审批用途：

- 识别高频费用申请人。
- 提醒审核者复核出差天数和费用标准。
- 推荐补充业务必要性、拆分费用或升级审批。

### 流程质量画像

用于判断申请人提交材料和流程配合质量。

核心指标：

- 草稿到提交平均耗时。
- 退回到重新提交平均耗时。
- 退单次数。
- 补充材料次数。
- 附件缺失次数。
- 发票金额不一致次数。
- 申请事由缺失次数。
- 业务地点缺失次数。
- 项目编号缺失次数。
- 同一申请多次修改次数。

审批用途：

- 提示“近期材料质量偏低，需要重点核对附件和事由”。
- 对高频退单申请人提高材料完整性检查权重。
- 对低质量申请触发补充材料建议，而不是直接判定费用风险。

### AI 协作画像

用于观察员工和系统的 AI 协作行为，不直接判定费用风险。

核心指标：

- AI 调用次数。
- AI 辅助生成申请次数。
- AI 解析票据次数。
- AI 预审次数。
- 语义解析次数。
- 输入 Token。
- 输出 Token。
- 总 Token。
- 估算调用成本。
- AI 建议被采纳次数。
- AI 建议被人工覆盖次数。
- AI 生成后人工修改次数。

运营用途：

- 观察哪些流程高度依赖 AI。
- 识别高成本用户、部门或功能入口。
- 衡量 AI 建议采纳率和被覆盖率。
- 为模型配置、成本控制和产品优化提供依据。

审批边界：

AI 使用多不等于风险高。Token 消耗、AI 调用次数不应直接推高费用审批风险，只能作为运营和辅助说明。

### 审批行为画像

用于分析审批人的审核效率和审核风格。

核心指标：

- 平均审核时长。
- 中位审核时长。
- 超 SLA 次数。
- 直接通过率。
- 退回率。
- 调减率。
- 高风险单据通过率。
- 系统建议采纳率。
- 系统建议覆盖率。
- 审批意见完整度。
- 审批积压数量。

治理用途：

- 识别审批积压。
- 识别过度宽松或过度退回的审批模式。
- 评估规则建议是否被人工持续覆盖。
- 为流程优化和审批授权调整提供依据。

## 计算窗口

第一版建议支持三个窗口：

```text
30 天：识别近期异常波动
90 天：作为审批详情页默认画像
180 天：用于稳定趋势和年度预算节奏
```

审批详情页默认读取 `90 天` 画像。运营看板可以切换 30 / 90 / 180 天。

## 同组基准

费用支出画像必须和可比人群比较，不能全公司一刀切。

建议同组口径：

```text
peer_group =
  department_id
+ position
+ grade
+ expense_type_scope
+ city_tier
+ project_type
+ window_days
```

当某个同组样本量不足时，逐级回退：

```text
部门 + 岗位 + 费用类型
→ 部门 + 费用类型
→ 岗位 + 费用类型
→ 公司 + 费用类型
```

回退必须写入 `peer_group_fallback_level`，避免审核者误以为基准非常精确。

## 分值模型

### 不建议使用一个大总分

不要这样计算：

```text
综合风险分 = 费用金额 + Token 消耗 + 操作时长 + 审核时长 + 退单次数
```

原因：

- Token 高可能代表高频使用 AI，不代表费用风险。
- 审核时长是审批人的行为，不是申请人的费用风险。
- 退单次数可能代表材料质量问题，不一定代表费用不合理。
- 一个总分会掩盖到底是哪一类风险触发。

### 建议使用多维分

```text
employee_behavior_profile =
  expense_profile_score
  process_quality_score
  ai_usage_score
  approval_behavior_score
```

每个分值都有自己的等级：

```text
0-39   normal
40-59  watch
60-79  review
80-100 escalation
```

审批详情页只展示与当前场景相关的分值：

```text
费用申请审批：
  展示 expense_profile_score
  展示 process_quality_score
  隐藏或弱化 ai_usage_score
  不展示 approval_behavior_score

运营看板：
  展示四类分值和趋势
```

## 指标权重建议

### 费用支出画像分

```text
expense_profile_score =
  frequency_score * 20%
+ amount_occupancy_score * 25%
+ peer_deviation_score * 25%
+ adjustment_history_score * 15%
+ current_claim_deviation_score * 15%
```

### 流程质量画像分

```text
process_quality_score =
  return_count_score * 25%
+ missing_attachment_score * 20%
+ invoice_mismatch_score * 20%
+ resubmit_duration_score * 15%
+ missing_business_context_score * 20%
```

### AI 协作画像分

AI 协作分不命名为风险分，建议叫 `ai_usage_intensity_score`。

```text
ai_usage_intensity_score =
  ai_call_count_score * 25%
+ token_cost_score * 25%
+ ai_generated_claim_ratio_score * 20%
+ ai_suggestion_override_score * 20%
+ failed_ai_call_score * 10%
```

含义：

- 分数高代表 AI 使用强度高或成本高。
- 不代表员工费用风险高。
- 主要用于成本治理、流程优化和模型配置。

### 审批行为画像分

审批行为分不命名为风险分，建议叫 `approval_behavior_score`。

```text
approval_behavior_score =
  avg_review_duration_score * 20%
+ sla_overdue_score * 20%
+ direct_approve_ratio_score * 20%
+ high_risk_approve_score * 20%
+ system_advice_override_score * 20%
```

含义：

- 分数高代表审批行为需要运营关注。
- 不直接代表审批人存在问题。
- 必须结合审批量、单据复杂度和部门业务特性解释。

## 数据来源

### 费用与流程数据

主要来源：

- `expense_claims`
- `expense_claim_items`
- 审批流转记录
- 退回 / 调减 / 补充材料记录
- 预算池和预算交易记录

需要补齐或确认的数据：

- 审批开始时间。
- 审批完成时间。
- 退回原因结构化字段。
- 调减前后金额。
- 补充材料事件。
- 审批意见是否为空。

### AI 与工具调用数据

主要来源：

- `AgentRun`
- `AgentToolCall`
- `SemanticParseLog`
- `runtime_chat.py`
- `ontology.py`
- `user_agent.py`
- `ocr.py`

需要注意：

不是所有模型入口都已经完整持久化 Token。第一版必须区分：

```text
exact_token_count：真实记录的 Token
estimated_token_count：按文本长度估算
unavailable：当前不可用
```

不能把估算值包装成真实计费数据。

## 存储设计

建议第一版使用通用画像快照表：

```text
employee_behavior_profile_snapshots
```

字段建议：

```text
id
subject_type                 applicant / approver / employee
subject_id                   employee_id
subject_name
department_id
department_name
position
grade

profile_type                 expense / process_quality / ai_usage / approval
window_days                  30 / 90 / 180
expense_type_scope           overall / travel / entertainment / ...
peer_group_key
peer_group_fallback_level

profile_score
profile_level
metrics_json
basis_codes_json
source_task_type
source_task_log_id
calculated_at
created_at
```

### 为什么用快照表

不要把画像直接写入员工表：

```text
employee.profile_score = 80
```

原因：

- 员工表是主数据，画像是动态计算结果。
- 审批审计需要知道当时为什么是这个分。
- 算法规则调整后，历史依据不能被覆盖。
- 快照可以支持趋势分析。

### 是否每个员工都存

不建议全员每天存。

第一版只存：

- 近 90 / 180 天有费用申请记录的员工。
- 当前存在待审批申请的员工。
- 上一期画像等级为 `watch`、`review`、`escalation` 的员工。
- AI 使用或审批行为达到运营关注阈值的员工。

无行为员工不生成画像快照。

## Hermes 调度策略

不重新写调度器，复用 Hermes 现有 cron 调度体系。

建议新增任务类型：

```text
employee_behavior_profile_scan
```

任务职责：

```text
1. 识别本次需要刷新画像的员工集合。
2. 聚合费用、流程、AI、审批行为指标。
3. 调用各画像子算法。
4. 写入 employee_behavior_profile_snapshots。
5. 在 HermesTaskExecutionLog 写入执行摘要。
```

建议频率：

```text
事件触发：申请提交、审批完成、退回、调减、AI 任务完成后，刷新相关员工。
每日轻量：只扫描昨日新增行为和上一期高关注员工。
每周全量：刷新同组基准、分位数和活跃员工画像。
每月复盘：分析阈值、规则覆盖率和人工覆盖率。
```

## 审批详情展示

费用审批详情页建议展示：

```text
申请人费用画像
流程材料质量
本次申请实时偏离
```

不建议在普通审批详情页直接展示：

```text
Token 消耗
AI 调用成本
审批人行为分
```

这些更适合管理员运营看板。

示例展示：

```text
申请人费用画像
近 90 天 · 销售部 / 客户经理 / 差旅费
状态：重点复核

触发依据：
- 近 90 天差旅金额处于同组 P88。
- 本次出差天数为同类 P75 的 1.67 倍。
- 最近 180 天存在 3 次调减或退回记录。

审核建议：
- 建议确认本次 5 天行程是否可压缩至 4 天。
- 如确属关键客户推进，请补充客户拜访安排和预期产出。
```

## 运营看板展示

管理员或运营人员可以看到更完整的画像：

```text
员工画像总览
├── 费用支出关注榜
├── 流程质量待优化榜
├── AI 使用强度榜
├── Token 成本趋势
├── 审批效率与积压
└── 系统建议采纳率
```

运营看板要标明：

- 哪些指标是真实采集。
- 哪些指标是估算。
- 哪些指标当前不可用。

## 第一版落地边界

第一版建议先做：

1. 费用支出画像。
2. 流程质量画像。
3. AI 协作画像的数据口径定义。
4. 通用快照表。
5. Hermes 画像扫描任务。

暂不做：

- 自动处罚或自动降标。
- 将 AI Token 消耗纳入费用风险分。
- 用 LLM 直接判断员工是否异常。
- 全员每日全量画像。

## 后续演进

### 第二阶段

- 接入审批详情页“申请人费用画像”卡片。
- 接入 Hermes 数字员工日志。
- 支持画像快照趋势对比。
- 支持规则中心根据高频触发指标生成规则草稿。

### 第三阶段

- 引入更稳定的同组基准缓存。
- 引入审批建议采纳率。
- 对 AI 使用成本做部门和功能维度分摊。
- 将画像结果接入运营看板。

### 第四阶段

- 根据真实历史数据调整权重。
- 对高覆盖、高误报规则做自动复盘。
- 让 Hermes 输出月度费用治理建议，但仍不直接改线上规则。