2.3 KiB
2.3 KiB
LLM Wiki 知识库架构
1. 定位
LLM Wiki 不是简单的文件库。
它是给 Agent 使用的知识底座,负责把制度、FAQ、审批经验、规则说明转成可检索、可引用、可版本化的知识。
2. 总体链路
文档上传
↓
格式解析
↓
正文抽取
↓
分块 Chunking
↓
元数据标注
↓
向量索引
↓
条款抽取
↓
知识候选
↓
人工审核
↓
发布 Wiki
↓
Agent 检索引用
3. 知识类型
policy_document
faq
rule_explanation
approval_case
risk_case
operation_manual
system_notice
4. 知识块结构
{
"chunk_id": "",
"document_id": "",
"title": "",
"content": "",
"domain": "reimbursement",
"scenario": "travel_reimbursement",
"tags": ["差旅", "住宿标准"],
"effective_date": "",
"version": "v1.0",
"source_page": 4,
"embedding_id": "",
"status": "published"
}
5. 条款抽取
Hermes 可以从制度文档中抽取条款候选。
示例:
{
"clause_type": "amount_limit",
"domain": "reimbursement",
"scenario": "travel_reimbursement",
"condition": {
"city_tier": "一线城市",
"employee_grade": "P5"
},
"limit": {
"amount": 800,
"currency": "CNY",
"period": "night"
},
"source": "差旅制度 2026 第 4 页"
}
该结果不直接变成规则,先进入规则候选池。
6. Wiki 发布流程
草稿知识
↓
Hermes 生成候选
↓
知识管理员审核
↓
发布
↓
Agent 可检索
7. 与 User Agent 的关系
User Agent 用 Wiki:
- 回答制度问题。
- 给风险解释提供条款依据。
- 给审批意见生成引用。
- 帮用户理解流程。
8. 与 Hermes 的关系
Hermes 用 Wiki:
- 每日知识候选生成。
- 发现制度与规则不一致。
- 生成规则优化建议。
- 生成 FAQ 候选。
9. 数据模型建议
knowledge_documents
knowledge_chunks
knowledge_embeddings
knowledge_candidates
knowledge_reviews
knowledge_versions
10. 开发阶段建议
Step 1: 文档上传和文件管理
Step 2: 文本抽取和分块
Step 3: 元数据标注
Step 4: 向量索引
Step 5: 知识检索 API
Step 6: User Agent 问答引用
Step 7: Hermes 知识候选生成
Step 8: 人工审核发布
Step 9: 条款抽取和规则候选