# LLM Wiki 知识库架构 ## 1. 定位 LLM Wiki 不是简单的文件库。 它是给 Agent 使用的知识底座,负责把制度、FAQ、审批经验、规则说明转成可检索、可引用、可版本化的知识。 ## 2. 总体链路 ```text 文档上传 ↓ 格式解析 ↓ 正文抽取 ↓ 分块 Chunking ↓ 元数据标注 ↓ 向量索引 ↓ 条款抽取 ↓ 知识候选 ↓ 人工审核 ↓ 发布 Wiki ↓ Agent 检索引用 ``` ## 3. 知识类型 ```text policy_document faq rule_explanation approval_case risk_case operation_manual system_notice ``` ## 4. 知识块结构 ```json { "chunk_id": "", "document_id": "", "title": "", "content": "", "domain": "reimbursement", "scenario": "travel_reimbursement", "tags": ["差旅", "住宿标准"], "effective_date": "", "version": "v1.0", "source_page": 4, "embedding_id": "", "status": "published" } ``` ## 5. 条款抽取 Hermes 可以从制度文档中抽取条款候选。 示例: ```json { "clause_type": "amount_limit", "domain": "reimbursement", "scenario": "travel_reimbursement", "condition": { "city_tier": "一线城市", "employee_grade": "P5" }, "limit": { "amount": 800, "currency": "CNY", "period": "night" }, "source": "差旅制度 2026 第 4 页" } ``` 该结果不直接变成规则,先进入规则候选池。 ## 6. Wiki 发布流程 ```text 草稿知识 ↓ Hermes 生成候选 ↓ 知识管理员审核 ↓ 发布 ↓ Agent 可检索 ``` ## 7. 与 User Agent 的关系 User Agent 用 Wiki: - 回答制度问题。 - 给风险解释提供条款依据。 - 给审批意见生成引用。 - 帮用户理解流程。 ## 8. 与 Hermes 的关系 Hermes 用 Wiki: - 每日知识候选生成。 - 发现制度与规则不一致。 - 生成规则优化建议。 - 生成 FAQ 候选。 ## 9. 数据模型建议 ```text knowledge_documents knowledge_chunks knowledge_embeddings knowledge_candidates knowledge_reviews knowledge_versions ``` ## 10. 开发阶段建议 ```text Step 1: 文档上传和文件管理 Step 2: 文本抽取和分块 Step 3: 元数据标注 Step 4: 向量索引 Step 5: 知识检索 API Step 6: User Agent 问答引用 Step 7: Hermes 知识候选生成 Step 8: 人工审核发布 Step 9: 条款抽取和规则候选 ```