149 lines
2.3 KiB
Markdown
149 lines
2.3 KiB
Markdown
|
|
# LLM Wiki 知识库架构
|
|||
|
|
|
|||
|
|
## 1. 定位
|
|||
|
|
|
|||
|
|
LLM Wiki 不是简单的文件库。
|
|||
|
|
|
|||
|
|
它是给 Agent 使用的知识底座,负责把制度、FAQ、审批经验、规则说明转成可检索、可引用、可版本化的知识。
|
|||
|
|
|
|||
|
|
## 2. 总体链路
|
|||
|
|
|
|||
|
|
```text
|
|||
|
|
文档上传
|
|||
|
|
↓
|
|||
|
|
格式解析
|
|||
|
|
↓
|
|||
|
|
正文抽取
|
|||
|
|
↓
|
|||
|
|
分块 Chunking
|
|||
|
|
↓
|
|||
|
|
元数据标注
|
|||
|
|
↓
|
|||
|
|
向量索引
|
|||
|
|
↓
|
|||
|
|
条款抽取
|
|||
|
|
↓
|
|||
|
|
知识候选
|
|||
|
|
↓
|
|||
|
|
人工审核
|
|||
|
|
↓
|
|||
|
|
发布 Wiki
|
|||
|
|
↓
|
|||
|
|
Agent 检索引用
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
## 3. 知识类型
|
|||
|
|
|
|||
|
|
```text
|
|||
|
|
policy_document
|
|||
|
|
faq
|
|||
|
|
rule_explanation
|
|||
|
|
approval_case
|
|||
|
|
risk_case
|
|||
|
|
operation_manual
|
|||
|
|
system_notice
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
## 4. 知识块结构
|
|||
|
|
|
|||
|
|
```json
|
|||
|
|
{
|
|||
|
|
"chunk_id": "",
|
|||
|
|
"document_id": "",
|
|||
|
|
"title": "",
|
|||
|
|
"content": "",
|
|||
|
|
"domain": "reimbursement",
|
|||
|
|
"scenario": "travel_reimbursement",
|
|||
|
|
"tags": ["差旅", "住宿标准"],
|
|||
|
|
"effective_date": "",
|
|||
|
|
"version": "v1.0",
|
|||
|
|
"source_page": 4,
|
|||
|
|
"embedding_id": "",
|
|||
|
|
"status": "published"
|
|||
|
|
}
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
## 5. 条款抽取
|
|||
|
|
|
|||
|
|
Hermes 可以从制度文档中抽取条款候选。
|
|||
|
|
|
|||
|
|
示例:
|
|||
|
|
|
|||
|
|
```json
|
|||
|
|
{
|
|||
|
|
"clause_type": "amount_limit",
|
|||
|
|
"domain": "reimbursement",
|
|||
|
|
"scenario": "travel_reimbursement",
|
|||
|
|
"condition": {
|
|||
|
|
"city_tier": "一线城市",
|
|||
|
|
"employee_grade": "P5"
|
|||
|
|
},
|
|||
|
|
"limit": {
|
|||
|
|
"amount": 800,
|
|||
|
|
"currency": "CNY",
|
|||
|
|
"period": "night"
|
|||
|
|
},
|
|||
|
|
"source": "差旅制度 2026 第 4 页"
|
|||
|
|
}
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
该结果不直接变成规则,先进入规则候选池。
|
|||
|
|
|
|||
|
|
## 6. Wiki 发布流程
|
|||
|
|
|
|||
|
|
```text
|
|||
|
|
草稿知识
|
|||
|
|
↓
|
|||
|
|
Hermes 生成候选
|
|||
|
|
↓
|
|||
|
|
知识管理员审核
|
|||
|
|
↓
|
|||
|
|
发布
|
|||
|
|
↓
|
|||
|
|
Agent 可检索
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
## 7. 与 User Agent 的关系
|
|||
|
|
|
|||
|
|
User Agent 用 Wiki:
|
|||
|
|
|
|||
|
|
- 回答制度问题。
|
|||
|
|
- 给风险解释提供条款依据。
|
|||
|
|
- 给审批意见生成引用。
|
|||
|
|
- 帮用户理解流程。
|
|||
|
|
|
|||
|
|
## 8. 与 Hermes 的关系
|
|||
|
|
|
|||
|
|
Hermes 用 Wiki:
|
|||
|
|
|
|||
|
|
- 每日知识候选生成。
|
|||
|
|
- 发现制度与规则不一致。
|
|||
|
|
- 生成规则优化建议。
|
|||
|
|
- 生成 FAQ 候选。
|
|||
|
|
|
|||
|
|
## 9. 数据模型建议
|
|||
|
|
|
|||
|
|
```text
|
|||
|
|
knowledge_documents
|
|||
|
|
knowledge_chunks
|
|||
|
|
knowledge_embeddings
|
|||
|
|
knowledge_candidates
|
|||
|
|
knowledge_reviews
|
|||
|
|
knowledge_versions
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
## 10. 开发阶段建议
|
|||
|
|
|
|||
|
|
```text
|
|||
|
|
Step 1: 文档上传和文件管理
|
|||
|
|
Step 2: 文本抽取和分块
|
|||
|
|
Step 3: 元数据标注
|
|||
|
|
Step 4: 向量索引
|
|||
|
|
Step 5: 知识检索 API
|
|||
|
|
Step 6: User Agent 问答引用
|
|||
|
|
Step 7: Hermes 知识候选生成
|
|||
|
|
Step 8: 人工审核发布
|
|||
|
|
Step 9: 条款抽取和规则候选
|
|||
|
|
```
|
|||
|
|
|