feat(flywheel): few-shot 在线检索注入打通风险规则编译链路

- 新增 FewShotStore：独立 Qdrant collection few_shot_samples，向量 upsert/search/delete，全程失败降级不阻塞主链路 - 新增 FewShotIngestionService：RiskObservation confirmed/false_positive → FewShotSample + 向量，带 sample_key 幂等去重 - 新增 FewShotRetriever：按 case 特征检索相似历史样本，去重 + token 预算 + 单条字符上限裁剪 - risk_observations.create_feedback commit 后挂 hook 自动入库，带 feature flag 和 try/except 兜底 - risk_rule_generation_prompt 新增 few_shot_samples 可选参数，合并进 examples 并标 source=historical_confirmed；risk_rule_generation 构造 prompt 前调 retriever，失败降级为空
2026-07-03 13:55:52 +08:00
parent 765cfb40f3
commit 3a9d154783
6 changed files with 584 additions and 1 deletions
--- a/server/src/app/services/few_shot_ingestion.py
+++ b/server/src/app/services/few_shot_ingestion.py
@@ -0,0 +1,177 @@
+"""Few-shot 样本入库编排：RiskObservation → FewShotSample → Qdrant。
+
+只处理人工确认为 confirmed / false_positive 的观测，把它转成一条
+:class:`FewShotSample`，持久化到 DB，并同步向量到 Qdrant。
+
+入库动作由 :meth:`RiskObservationService.create_feedback` 在 commit 后触发，
+本服务全程吞异常（只记日志），保证反馈主流程不被 few-shot 链路拖崩。
+"""
+
+from __future__ import annotations
+
+from typing import Any
+
+from sqlalchemy import select
+from sqlalchemy.orm import Session
+
+from app.core.logging import get_logger
+from app.models.few_shot_sample import FewShotSample
+from app.models.risk_observation import RiskObservation, RiskObservationFeedback
+from app.services.embedding_provider import EmbeddingProvider
+from app.services.few_shot_store import FewShotStore
+
+logger = get_logger("app.services.few_shot_ingestion")
+
+# 仅这两个 feedback_status 视为已确认样本，会入库
+CONFIRMED_LABELS = {"confirmed", "false_positive"}
+
+# label → 自然语言结论（当 feedback.comment 缺失时兜底）
+LABEL_CONCLUSION_FALLBACK = {
+    "confirmed": "经人工复核确认，该风险线索成立，需按规则拦截或补件。",
+    "false_positive": "经人工复核判定为误报，相似情形不应触发该风险规则。",
+}
+
+
+class FewShotIngestionService:
+    """把已确认的风险观测沉淀为 few-shot 样本。"""
+
+    def __init__(self, db: Session) -> None:
+        self.db = db
+
+    def ingest_observation_feedback(
+        self,
+        observation: RiskObservation,
+        feedback: RiskObservationFeedback,
+    ) -> FewShotSample | None:
+        """人工确认/误报后调用，写入并同步向量。"""
+
+        label = observation.feedback_status
+        if label not in CONFIRMED_LABELS:
+            return None
+
+        sample_key = f"obs:{observation.id}"
+        sample = self.db.scalar(
+            select(FewShotSample).where(FewShotSample.sample_key == sample_key)
+        )
+
+        domain = self._extract_domain(observation)
+        case_text = self._build_case_text(observation)
+        conclusion_text = self._build_conclusion_text(observation, feedback, label)
+        payload = self._build_payload(observation, feedback, label)
+
+        if sample is None:
+            sample = FewShotSample(
+                sample_key=sample_key,
+                source_observation_id=observation.id,
+                scene="risk_rule_generation",
+                domain=domain,
+                risk_type=observation.risk_type or "",
+                risk_level=observation.risk_level or "",
+                label=label,
+                case_text=case_text,
+                conclusion_text=conclusion_text,
+                payload_json=payload,
+                status="active",
+            )
+            self.db.add(sample)
+        else:
+            sample.label = label
+            sample.domain = domain
+            sample.risk_type = observation.risk_type or ""
+            sample.risk_level = observation.risk_level or ""
+            sample.case_text = case_text
+            sample.conclusion_text = conclusion_text
+            sample.payload_json = payload
+            sample.status = "active"
+            sample.vector_id = sample.vector_id
+        try:
+            self.db.commit()
+            self.db.refresh(sample)
+        except Exception:
+            logger.exception("few-shot 样本持久化失败 observation_id=%s", observation.id)
+            self.db.rollback()
+            return None
+
+        vector_id = self._store().upsert(sample)
+        if vector_id:
+            sample.vector_id = vector_id
+            try:
+                self.db.commit()
+            except Exception:
+                logger.warning("few-shot vector_id 回写失败 sample_id=%s", sample.id)
+        return sample
+
+    def retract_observation(self, observation_id: str) -> bool:
+        """观测被撤销时删掉对应样本及其向量。"""
+
+        sample = self.db.scalar(
+            select(FewShotSample).where(FewShotSample.source_observation_id == observation_id)
+        )
+        if sample is None:
+            return False
+        if sample.vector_id:
+            self._store().delete_by_vector_id(sample.vector_id)
+        try:
+            self.db.delete(sample)
+            self.db.commit()
+            return True
+        except Exception:
+            logger.exception("few-shot 样本删除失败 observation_id=%s", observation_id)
+            self.db.rollback()
+            return False
+
+    def _store(self) -> FewShotStore:
+        provider = EmbeddingProvider.from_settings(self.db)
+        return FewShotStore(provider)
+
+    def _extract_domain(self, observation: RiskObservation) -> str:
+        ontology = observation.ontology_json or {}
+        return str(ontology.get("domain") or "")
+
+    def _build_case_text(self, observation: RiskObservation) -> str:
+        parts = [
+            observation.title or "",
+            observation.description or "",
+            observation.risk_signal or "",
+            observation.risk_type or "",
+        ]
+        ontology = observation.ontology_json or {}
+        scenario = ontology.get("scenario")
+        if scenario:
+            parts.append(f"场景:{scenario}")
+        risk_signals = ontology.get("risk_signals")
+        if isinstance(risk_signals, list) and risk_signals:
+            parts.append("信号:" + "|".join(str(s) for s in risk_signals))
+        return "\n".join(part for part in parts if part).strip()
+
+    def _build_conclusion_text(
+        self,
+        observation: RiskObservation,
+        feedback: RiskObservationFeedback,
+        label: str,
+    ) -> str:
+        comment = (feedback.comment or "").strip()
+        if comment:
+            return f"[{label}] {comment}"
+        return LABEL_CONCLUSION_FALLBACK.get(label, label)
+
+    def _build_payload(
+        self,
+        observation: RiskObservation,
+        feedback: RiskObservationFeedback,
+        label: str,
+    ) -> dict[str, Any]:
+        return {
+            "label": label,
+            "risk_type": observation.risk_type,
+            "risk_signal": observation.risk_signal,
+            "risk_level": observation.risk_level,
+            "feedback_type": feedback.feedback_type,
+            "feedback_comment": feedback.comment or "",
+            "feedback_actor": feedback.actor or "",
+            "ontology": observation.ontology_json or {},
+            "policy_refs": observation.policy_refs_json or [],
+            "evidence": observation.evidence_json or [],
+            "subject_label": observation.subject_label or "",
+            "claim_no": observation.claim_no or "",
+        }
--- a/server/src/app/services/few_shot_retrieval.py
+++ b/server/src/app/services/few_shot_retrieval.py
@@ -0,0 +1,122 @@
+"""Few-shot 检索器：按当前 case 特征检索相似历史样本，拼成注入块。
+
+从 :class:`FewShotStore` 取相似样本，转成可供 prompt 构造函数直接使用的结构。
+带 token 预算裁剪和去重，确保不撑爆 prompt。
+
+典型用法（在构造 prompt 之前调用）::
+
+    retriever = FewShotRetriever.from_session(session)
+    samples = retriever.retrieve_for_risk_rule_generation(
+        domain="travel", natural_language="票据城市与申报地不一致"
+    )
+    messages = build_risk_rule_compiler_messages(
+        ...,
+        few_shot_samples=samples,
+    )
+"""
+
+from __future__ import annotations
+
+from typing import Any
+
+from sqlalchemy.orm import Session
+
+from app.core.logging import get_logger
+from app.services.embedding_provider import EmbeddingProvider
+from app.services.few_shot_store import FewShotStore
+
+logger = get_logger("app.services.few_shot_retrieval")
+
+# 单条 few-shot 样本估算 token 数（用于预算裁剪）
+SAMPLE_TOKEN_BUDGET = 1200
+# 单条样本最大字符数，超长直接截断结论，避免撑爆 prompt
+SINGLE_SAMPLE_MAX_CHARS = 400
+# 历史样本最多注入条数（与原内置 examples 合并后总量受限）
+MAX_HISTORICAL_SAMPLES = 3
+
+
+class FewShotRetriever:
+    """按 case 特征检索已确认样本，返回 prompt 可直接消费的结构。"""
+
+    def __init__(self, store: FewShotStore) -> None:
+        self._store = store
+
+    @classmethod
+    def from_session(cls, session: Session) -> "FewShotRetriever":
+        provider = EmbeddingProvider.from_settings(session)
+        return cls(FewShotStore(provider))
+
+    def retrieve_for_risk_rule_generation(
+        self,
+        *,
+        domain: str = "",
+        risk_type: str = "",
+        natural_language: str,
+        top_k: int = MAX_HISTORICAL_SAMPLES,
+    ) -> list[dict[str, Any]]:
+        """检索与当前规则需求相似的历史样本，返回注入块列表。"""
+
+        case_text = self._build_case_text(
+            natural_language=natural_language,
+            domain=domain,
+            risk_type=risk_type,
+        )
+        if not case_text:
+            return []
+        hits = self._store.search(
+            case_text,
+            scene="risk_rule_generation",
+            labels=["confirmed", "false_positive"],
+            top_k=top_k,
+        )
+        return self._hits_to_injection_blocks(hits)
+
+    def _build_case_text(
+        self,
+        *,
+        natural_language: str,
+        domain: str = "",
+        risk_type: str = "",
+    ) -> str:
+        parts = [natural_language, domain, risk_type]
+        return "\n".join(p for p in parts if p).strip()
+
+    def _hits_to_injection_blocks(
+        self,
+        hits: list[dict[str, Any]],
+    ) -> list[dict[str, Any]]:
+        """把检索命中转成 prompt 可消费的块，做去重和预算裁剪。"""
+
+        blocks: list[dict[str, Any]] = []
+        seen_conclusions: set[str] = set()
+        budget = SAMPLE_TOKEN_BUDGET
+        for hit in hits:
+            conclusion = (hit.get("conclusion_text") or "").strip()
+            if not conclusion or conclusion in seen_conclusions:
+                continue
+            # 超长结论截断到上限，避免单条样本占用过多预算
+            if len(conclusion) > SINGLE_SAMPLE_MAX_CHARS:
+                conclusion = conclusion[:SINGLE_SAMPLE_MAX_CHARS]
+            payload = hit.get("payload_json") or {}
+            block = {
+                "source": "historical_confirmed",
+                "label": hit.get("label"),
+                "domain": hit.get("domain") or "",
+                "risk_type": hit.get("risk_type") or "",
+                "score": round(float(hit.get("score") or 0.0), 4),
+                "conclusion": conclusion,
+                "context": {
+                    "risk_signal": payload.get("risk_signal") or "",
+                    "risk_level": payload.get("risk_level") or "",
+                    "ontology": payload.get("ontology") or {},
+                    "feedback_comment": payload.get("feedback_comment") or "",
+                },
+            }
+            # 粗略 token 估算（按字符数 / 1.6 近似中文 token 比）
+            estimated_tokens = int(len(conclusion) / 1.6) + 40
+            if estimated_tokens > budget:
+                break
+            budget -= estimated_tokens
+            blocks.append(block)
+            seen_conclusions.add(conclusion)
+        return blocks
--- a/server/src/app/services/few_shot_store.py
+++ b/server/src/app/services/few_shot_store.py
@@ -0,0 +1,214 @@
+"""Few-shot 样本的 Qdrant 向量存储。
+
+独立于 LightRAG 的 Qdrant 客户端，使用专用 collection ``few_shot_samples``，
+与知识库 RAG 的 collection 隔离。所有操作失败都不抛异常（记日志返回空），
+保证主链路不阻塞。
+
+向量来自 :class:`EmbeddingProvider`，payload 带业务过滤字段（scene/label/domain/risk_type），
+检索时按这些字段过滤 + 向量相似度排序。
+"""
+
+from __future__ import annotations
+
+import os
+import uuid
+from typing import Any
+
+from app.core.logging import get_logger
+from app.services.knowledge_rag import _resolve_default_qdrant_url
+
+logger = get_logger("app.services.few_shot_store")
+
+FEW_SHOT_COLLECTION = "few_shot_samples"
+
+
+def _resolve_qdrant_config() -> tuple[str, str]:
+    """复用 knowledge_rag 的 Qdrant URL/key 解析逻辑。"""
+
+    url = os.environ.get("QDRANT_URL", "").strip() or _resolve_default_qdrant_url()
+    api_key = os.environ.get("QDRANT_API_KEY", "").strip()
+    return url, api_key
+
+
+class FewShotStore:
+    """对 Qdrant 的轻量封装，专供 few-shot 样本检索使用。
+
+    设计要点：
+    - 惰性创建 client 和 collection，首次操作时初始化。
+    - 所有公共方法吞异常（返回空/False），主链路永远不被拖崩。
+    - 向量写入和检索都依赖外部传入的 :class:`EmbeddingProvider`，
+      由调用方保证与配置一致。
+    """
+
+    def __init__(self, embedding_provider: Any) -> None:
+        self._embedding_provider = embedding_provider
+        self._client: Any = None
+        self._ensured = False
+
+    def _client_or_none(self) -> Any:
+        """惰性初始化 QdrantClient，失败返回 None。"""
+
+        if self._client is not None:
+            return self._client
+        try:
+            from qdrant_client import QdrantClient
+
+            url, api_key = _resolve_qdrant_config()
+            self._client = QdrantClient(url=url, api_key=api_key or None)
+        except Exception:
+            logger.warning("few-shot QdrantClient 初始化失败，本轮操作跳过", exc_info=True)
+            self._client = None
+        return self._client
+
+    def _ensure_collection(self) -> bool:
+        """确保 collection 存在，成功返回 True。"""
+
+        if self._ensured:
+            return True
+        client = self._client_or_none()
+        if client is None:
+            return False
+        try:
+            from qdrant_client.http.exceptions import UnexpectedResponse
+
+            try:
+                client.get_collection(FEW_SHOT_COLLECTION)
+                self._ensured = True
+                return True
+            except UnexpectedResponse as exc:
+                if exc.status_code != 404:
+                    raise
+            # collection 不存在则创建
+            dim = self._embedding_provider.dimension()
+            from qdrant_client.http.models import (
+                Distance,
+                VectorParams,
+                PayloadSchemaType,
+            )
+
+            client.create_collection(
+                collection_name=FEW_SHOT_COLLECTION,
+                vectors_config=VectorParams(size=dim, distance=Distance.COSINE),
+            )
+            for field, field_type in [
+                ("sample_id", PayloadSchemaType.KEYWORD),
+                ("scene", PayloadSchemaType.KEYWORD),
+                ("label", PayloadSchemaType.KEYWORD),
+                ("domain", PayloadSchemaType.KEYWORD),
+                ("risk_type", PayloadSchemaType.KEYWORD),
+                ("status", PayloadSchemaType.KEYWORD),
+            ]:
+                try:
+                    client.create_payload_index(
+                        collection_name=FEW_SHOT_COLLECTION,
+                        field_name=field,
+                        field_schema=field_type,
+                    )
+                except Exception:
+                    logger.debug("payload index 创建跳过 field=%s", field, exc_info=True)
+            self._ensured = True
+            logger.info("few-shot collection 创建成功 dim=%s", dim)
+            return True
+        except Exception:
+            logger.warning("few-shot collection 初始化失败，本轮操作跳过", exc_info=True)
+            return False
+
+    def upsert(self, sample: Any) -> str | None:
+        """把一条样本向量化并写入 Qdrant，返回 vector_id，失败返回 None。"""
+
+        if not self._ensure_collection():
+            return None
+        client = self._client
+        try:
+            vector = self._embedding_provider.embed([sample.case_text])[0]
+        except Exception:
+            logger.warning("few-shot embedding 失败 sample_key=%s", getattr(sample, "sample_key", ""), exc_info=True)
+            return None
+        vector_id = uuid.uuid4().hex
+        payload = {
+            "sample_id": sample.id,
+            "scene": sample.scene,
+            "label": sample.label,
+            "domain": sample.domain,
+            "risk_type": sample.risk_type,
+            "risk_level": sample.risk_level,
+            "status": getattr(sample, "status", "active"),
+            "conclusion_text": sample.conclusion_text,
+            "payload_json": sample.payload_json,
+        }
+        try:
+            client.upsert(
+                collection_name=FEW_SHOT_COLLECTION,
+                points=[{"id": vector_id, "vector": vector, "payload": payload}],
+            )
+            return vector_id
+        except Exception:
+            logger.warning("few-shot upsert 失败 sample_key=%s", getattr(sample, "sample_key", ""), exc_info=True)
+            return None
+
+    def search(
+        self,
+        case_text: str,
+        *,
+        scene: str | None = None,
+        labels: list[str] | None = None,
+        top_k: int = 3,
+    ) -> list[dict[str, Any]]:
+        """按 case_text 检索相似样本，可按 scene/label 过滤。失败返回空列表。"""
+
+        if not case_text or not self._ensure_collection():
+            return []
+        client = self._client
+        try:
+            vector = self._embedding_provider.embed([case_text])[0]
+        except Exception:
+            logger.warning("few-shot 检索 embedding 失败", exc_info=True)
+            return []
+        must: list[dict[str, Any]] = [{"key": "status", "match": {"value": "active"}}]
+        if scene:
+            must.append({"key": "scene", "match": {"value": scene}})
+        if labels:
+            must.append({"key": "label", "match": {"any": labels}})
+        try:
+            from qdrant_client.http.models import Filter
+
+            results = client.query_points(
+                collection_name=FEW_SHOT_COLLECTION,
+                query=vector,
+                query_filter=Filter(must=must),
+                limit=top_k,
+                with_payload=True,
+            ).points
+        except Exception:
+            logger.warning("few-shot 检索失败", exc_info=True)
+            return []
+        hits: list[dict[str, Any]] = []
+        for point in results:
+            payload = getattr(point, "payload", None) or {}
+            hits.append(
+                {
+                    "sample_id": payload.get("sample_id"),
+                    "score": float(getattr(point, "score", 0.0)),
+                    "label": payload.get("label"),
+                    "domain": payload.get("domain"),
+                    "risk_type": payload.get("risk_type"),
+                    "conclusion_text": payload.get("conclusion_text") or "",
+                    "payload_json": payload.get("payload_json") or {},
+                }
+            )
+        return hits
+
+    def delete_by_vector_id(self, vector_id: str) -> bool:
+        """按 vector_id 删除向量，失败返回 False。"""
+
+        if not vector_id or not self._ensure_collection():
+            return False
+        try:
+            self._client.delete(
+                collection_name=FEW_SHOT_COLLECTION,
+                points_selector=[vector_id],
+            )
+            return True
+        except Exception:
+            logger.warning("few-shot 删除失败 vector_id=%s", vector_id, exc_info=True)
+            return False
--- a/server/src/app/services/risk_observations.py
+++ b/server/src/app/services/risk_observations.py
@@ -1,5 +1,6 @@
 from __future__ import annotations

+import os
 from datetime import UTC, datetime, timedelta
 from decimal import Decimal
 from typing import Any
@@ -8,6 +9,7 @@ from sqlalchemy import func, select
 from sqlalchemy.orm import Session, joinedload

 from app.algorithem.risk_graph import RiskHistoryStats, RiskObservationDraft
+from app.core.logging import get_logger
 from app.db.base import Base
 from app.models.financial_record import ExpenseClaim
 from app.models.risk_observation import RiskObservation, RiskObservationFeedback
@@ -17,6 +19,8 @@ from app.schemas.risk_observation import (
 )
 from app.services.expense_claim_risk_stage import normalize_risk_business_stage

+logger = get_logger("app.services.risk_observations")
+
 HIGH_LEVELS = {"high", "critical"}
 SEVERITY_SCORE = {
    "low": 32,
@@ -322,8 +326,27 @@ class RiskObservationService:
            observation.status, observation.feedback_status = mapped
        self.db.commit()
        self.db.refresh(feedback)
+        self._maybe_ingest_few_shot(observation, feedback)
        return feedback

+    def _maybe_ingest_few_shot(
+        self,
+        observation: RiskObservation,
+        feedback: RiskObservationFeedback,
+    ) -> None:
+        """人工确认/误报后把样本沉淀进 few-shot 池，任何失败都不影响主流程。"""
+
+        if os.environ.get("FEW_SHOT_INJECTION_ENABLED", "true").strip().lower() in {"0", "false", "no"}:
+            return
+        if observation.feedback_status not in {"confirmed", "false_positive"}:
+            return
+        try:
+            from app.services.few_shot_ingestion import FewShotIngestionService
+
+            FewShotIngestionService(self.db).ingest_observation_feedback(observation, feedback)
+        except Exception:
+            logger.exception("few-shot ingestion failed for observation %s", observation.id)
+
    def summarize_dashboard(
        self,
        *,
--- a/server/src/app/services/risk_rule_generation.py
+++ b/server/src/app/services/risk_rule_generation.py
@@ -234,6 +234,10 @@ class RiskRuleGenerationService:
            }
            for item in fields
        ]
+        few_shot_samples = self._retrieve_few_shot_samples(
+            domain=domain,
+            natural_language=natural_language,
+        )
        messages = build_risk_rule_compiler_messages(
            domain=domain,
            domain_label=BUSINESS_DOMAIN_LABELS[domain],
@@ -243,6 +247,7 @@ class RiskRuleGenerationService:
            expense_category_label=expense_category_label,
            natural_language=natural_language,
            available_fields=field_payload,
+            few_shot_samples=few_shot_samples,
        )
        answer = self.runtime_chat_service.complete(
            messages,
@@ -263,6 +268,29 @@ class RiskRuleGenerationService:
        payload = unwrap_semantic_plan_payload(payload)
        return self._sanitize_model_draft(payload, fields=fields)

+    def _retrieve_few_shot_samples(
+        self,
+        *,
+        domain: str,
+        natural_language: str,
+    ) -> list[dict[str, Any]]:
+        """检索已确认历史样本，失败降级为空列表。"""
+
+        import os
+
+        if os.environ.get("FEW_SHOT_INJECTION_ENABLED", "true").strip().lower() in {"0", "false", "no"}:
+            return []
+        try:
+            from app.services.few_shot_retrieval import FewShotRetriever
+
+            retriever = FewShotRetriever.from_session(self.db)
+            return retriever.retrieve_for_risk_rule_generation(
+                domain=domain,
+                natural_language=natural_language,
+            )
+        except Exception:
+            return []
+
    def _sanitize_model_draft(
        self,
        payload: dict[str, Any],
--- a/server/src/app/services/risk_rule_generation_prompt.py
+++ b/server/src/app/services/risk_rule_generation_prompt.py
@@ -14,10 +14,15 @@ def build_risk_rule_compiler_messages(
    expense_category_label: str,
    natural_language: str,
    available_fields: list[dict[str, Any]],
+    few_shot_samples: list[dict[str, Any]] | None = None,
 ) -> list[dict[str, str]]:
    """构造自然语言规则编译提示词。

    大模型只负责把业务语言拆成“语义计划”，后端会校验字段、操作符和模板。
+
+    ``few_shot_samples`` 是从已确认历史样本中检索出来的相似案例，会被合并进
+    ``examples`` 字段并标注 ``source: "historical_confirmed"``，让编译器参考
+    过往人工结论。传 ``None`` 或空列表时行为与历史完全一致（向后兼容）。
    """

    schema = {
@@ -161,6 +166,20 @@ def build_risk_rule_compiler_messages(
            },
        }
    ]
+    historical_examples: list[dict[str, Any]] = []
+    if few_shot_samples:
+        for sample in few_shot_samples:
+            historical_examples.append(
+                {
+                    "source": "historical_confirmed",
+                    "label": sample.get("label"),
+                    "domain": sample.get("domain") or "",
+                    "risk_type": sample.get("risk_type") or "",
+                    "conclusion": sample.get("conclusion") or "",
+                    "context": sample.get("context") or {},
+                }
+            )
+    merged_examples = historical_examples + examples
    return [
        {
            "role": "system",
@@ -186,7 +205,7 @@ def build_risk_rule_compiler_messages(
                    "natural_language": natural_language,
                    "available_fields": available_fields,
                    "required_json_shape": response_schema,
-                    "examples": examples,
+                    "examples": merged_examples,
                },
                ensure_ascii=False,
            ),