caoxiaozhu 88e91a5900 feat(ocr): PDF 文本层可用时跳过 worker 调用并补装 poppler-data
- OcrService 提取 PDF 文本层后若有效字符达到阈值,直接构建文档并写入结果缓存,不再触发 OCR worker,仅无文本层时才解析 python_bin/worker_path 调用 worker
- _build_text_layer_document 复用 AggregatedOcrDocument 聚合文本层片段,_has_usable_pdf_text_layer 基于 meaningful_char_count 判定
- docker-compose 与 paddleocr bootstrap 脚本补装 poppler-data,保证 PDF 文本层抽取的中文编码正确
- 新增文本层直取与运行时依赖两项 ocr_service 单测
2026-06-21 23:23:59 +08:00

X-Financial

项目结构已按前后端拆开:

  • web/:前端工程(当前 Vue + Vite 项目)
  • server/:后端工程目录
  • docs/:方案和阶段文档
  • UI/:界面参考稿
  • document/:业务文档

根目录统一环境变量:

  • .env
  • .env.example

这里集中维护:

  • 前端启动端口
  • 后端启动端口
  • PostgreSQL 连接参数
  • DATABASE_URL
  • REDIS_URL

从根目录统一启动:

./start.sh

可选模式:

./start.sh web
./start.sh server
./start.sh all

根目录 start.sh 是统一编排入口;前端和后端的子启动脚本分别是 web/web_start.shserver/server_start.sh

手动进入前端目录:

cd web
npm run dev
Description
影子财务系统
Readme 106 MiB
Languages
JavaScript 44.9%
Python 42.9%
Vue 5.8%
CSS 4.7%
HTML 1.2%
Other 0.5%