Files
X-Financial/document/development/agent plan/12_llm_wiki_knowledge_architecture.md

2.3 KiB
Raw Blame History

LLM Wiki 知识库架构

1. 定位

LLM Wiki 不是简单的文件库。

它是给 Agent 使用的知识底座负责把制度、FAQ、审批经验、规则说明转成可检索、可引用、可版本化的知识。

2. 总体链路

文档上传
  ↓
格式解析
  ↓
正文抽取
  ↓
分块 Chunking
  ↓
元数据标注
  ↓
向量索引
  ↓
条款抽取
  ↓
知识候选
  ↓
人工审核
  ↓
发布 Wiki
  ↓
Agent 检索引用

3. 知识类型

policy_document
faq
rule_explanation
approval_case
risk_case
operation_manual
system_notice

4. 知识块结构

{
  "chunk_id": "",
  "document_id": "",
  "title": "",
  "content": "",
  "domain": "reimbursement",
  "scenario": "travel_reimbursement",
  "tags": ["差旅", "住宿标准"],
  "effective_date": "",
  "version": "v1.0",
  "source_page": 4,
  "embedding_id": "",
  "status": "published"
}

5. 条款抽取

Hermes 可以从制度文档中抽取条款候选。

示例:

{
  "clause_type": "amount_limit",
  "domain": "reimbursement",
  "scenario": "travel_reimbursement",
  "condition": {
    "city_tier": "一线城市",
    "employee_grade": "P5"
  },
  "limit": {
    "amount": 800,
    "currency": "CNY",
    "period": "night"
  },
  "source": "差旅制度 2026 第 4 页"
}

该结果不直接变成规则,先进入规则候选池。

6. Wiki 发布流程

草稿知识
  ↓
Hermes 生成候选
  ↓
知识管理员审核
  ↓
发布
  ↓
Agent 可检索

7. 与 User Agent 的关系

User Agent 用 Wiki

  • 回答制度问题。
  • 给风险解释提供条款依据。
  • 给审批意见生成引用。
  • 帮用户理解流程。

8. 与 Hermes 的关系

Hermes 用 Wiki

  • 每日知识候选生成。
  • 发现制度与规则不一致。
  • 生成规则优化建议。
  • 生成 FAQ 候选。

9. 数据模型建议

knowledge_documents
knowledge_chunks
knowledge_embeddings
knowledge_candidates
knowledge_reviews
knowledge_versions

10. 开发阶段建议

Step 1: 文档上传和文件管理
Step 2: 文本抽取和分块
Step 3: 元数据标注
Step 4: 向量索引
Step 5: 知识检索 API
Step 6: User Agent 问答引用
Step 7: Hermes 知识候选生成
Step 8: 人工审核发布
Step 9: 条款抽取和规则候选