88e91a59001fbadf66737749c9201eda7f5b442d
- OcrService 提取 PDF 文本层后若有效字符达到阈值,直接构建文档并写入结果缓存,不再触发 OCR worker,仅无文本层时才解析 python_bin/worker_path 调用 worker - _build_text_layer_document 复用 AggregatedOcrDocument 聚合文本层片段,_has_usable_pdf_text_layer 基于 meaningful_char_count 判定 - docker-compose 与 paddleocr bootstrap 脚本补装 poppler-data,保证 PDF 文本层抽取的中文编码正确 - 新增文本层直取与运行时依赖两项 ocr_service 单测
X-Financial
项目结构已按前后端拆开:
web/:前端工程(当前 Vue + Vite 项目)server/:后端工程目录docs/:方案和阶段文档UI/:界面参考稿document/:业务文档
根目录统一环境变量:
.env.env.example
这里集中维护:
- 前端启动端口
- 后端启动端口
- PostgreSQL 连接参数
DATABASE_URLREDIS_URL
从根目录统一启动:
./start.sh
可选模式:
./start.sh web
./start.sh server
./start.sh all
根目录 start.sh 是统一编排入口;前端和后端的子启动脚本分别是 web/web_start.sh 与 server/server_start.sh。
手动进入前端目录:
cd web
npm run dev
Description
Languages
JavaScript
44.9%
Python
42.9%
Vue
5.8%
CSS
4.7%
HTML
1.2%
Other
0.5%