Files
JARVIS/backend/data/jarvis.db

578 lines
236 KiB
Plaintext
Raw Normal View History

2026-03-21 10:13:29 +08:00
SQLite format 3@ B;'B.<2E><0F>/<0F><0F>
<EFBFBD> <0C>
e<08>
:F<07>*<07><05>Q<05><03><01><03>p33;O)indexsqlite_autoindex_task_histories_1task_histories<18>I+<01>%indexix_document_chunks_document_iddocument_chunksCREATE INDEX ix_document_chunks_document_id ON document_chunks (document_id)<29>"++<01>{tabledocument_chunksdocument_chunksCREATE TABLE document_chunks (
document_id VARCHAR(36) NOT NULL,
chunk_index INTEGER NOT NULL,
content TEXT NOT NULL,
metadata_ VARCHAR(2000),
chroma_collection VARCHAR(255),
chroma_id VARCHAR(255),
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id),
FOREIGN KEY(document_id) REFERENCES documents (id)
)=Q+indexsqlite_autoindex_document_chunks_1document_chunksr='<01> indexix_conversations_user_idconversationsCREATE INDEX ix_conversations_user_id ON conversations (user_id)<29>/''<01>tableconversationsconversationsCREATE TABLE conversations (
user_id VARCHAR(36) NOT NULL,
title VARCHAR(500),
message_count INTEGER,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id),
FOREIGN KEY(user_id) REFERENCES users (id)
)9M'indexsqlite_autoindex_conversations_1conversationsj9#<01>indexix_forum_posts_user_idforum_postsCREATE INDEX ix_forum_posts_user_id ON forum_posts (user_id)<29> ##<01>ktableforum_postsforum_postsCREATE TABLE forum_posts (
user_id VARCHAR(36) NOT NULL,
title VARCHAR(500) NOT NULL,
content TEXT NOT NULL,
category VARCHAR(100),
is_executed BOOLEAN,
execution_result TEXT,
reply_count INTEGER,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id),
FOREIGN KEY(user_id) REFERENCES users (id)
)5I#indexsqlite_autoindex_forum_posts_1forum_postsN +iindexix_tasks_statustasks CREATE INDEX ix_tasks_status ON tasks (status)Q -mindexix_tasks_user_idtasks CREATE INDEX ix_tasks_user_id ON tasks (user_id)<29> <01>tabletaskstasks
CREATE TABLE tasks (
user_id VARCHAR(36) NOT NULL,
title VARCHAR(500) NOT NULL,
description TEXT,
status VARCHAR(11) NOT NULL,
priority VARCHAR(6) NOT NULL,
due_date DATETIME,
completed_at DATETIME,
tags VARCHAR(1000),
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id),
FOREIGN KEY(user_id) REFERENCES users (id)
))
=indexsqlite_autoindex_tasks_1tasks a5}indexix_documents_user_iddocuments CREATE INDEX ix_documents_user_id ON documents (user_id)<29>V<01>{tabledocumentsdocumentsCREATE TABLE documents (
user_id VARCHAR(36) NOT NULL,
title VARCHAR(500) NOT NULL,
filename VARCHAR(500) NOT NULL,
file_type VARCHAR(50) NOT NULL,
file_size INTEGER NOT NULL,
file_path VARCHAR(1000) NOT NULL,
summary TEXT,
chunk_count INTEGER,
is_indexed BOOLEAN,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id),
FOREIGN KEY(user_id) REFERENCES users (id)
)1Eindexsqlite_autoindex_documents_1documents<08>7<01>ItableagentsagentsCREATE TABLE agents (
name VARCHAR(100) NOT NULL,
role VARCHAR(100) NOT NULL,
description TEXT,
system_prompt TEXT NOT NULL,
is_active BOOLEAN,
is_default BOOLEAN,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id)
)+?indexsqlite_autoindex_agents_1agentsR)sindexix_users_emailusersCREATE UNIQUE INDEX ix_users_email ON users (email)<29>;<01>UtableusersusersCREATE TABLE users (
email VARCHAR(255) NOT NULL,
hashed_password VARCHAR(255) NOT NULL,
full_name VARCHAR(255),
is_active BOOLEAN NOT NULL,
is_superuser BOOLEAN NOT NULL,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id)
))=indexsqlite_autoindex_users_1user  
mH<0E> <0A> *
m<00>: /<2F># UAA<41>test2@example.com$2b$12$ESX5to5QnFGjra9u5HMSEuZXvV/Y2hn0dsaCXMpRHrkeioLkXzJ/uTest User 21870bd6c-c88f-480c-95ad-2eb33a1ed3f02026-03-20 15:56:11.9177482026-03-20 15:56:28.274389{"chat": [{"name": "GPT-4o Primary", "provider": "openai", "model": "gpt-4o", "base_url": "https://api.openai.com/v1", "api_key": "sk-test1", "enabled": true}, {"name": "GPT-4o Mini Backup", "provider": "openai", "model": "gpt-4o-mini", "base_url": "https://api.openai.com/v1", "api_key": "sk-test2", "enabled": false}], "vlm": [{"name": "GPT-4V Vision", "provider": "openai", "model": "gpt-4o", "base_url": "https://api.openai.com/v1", "api_key": "sk-test1", "enabled": true}], "embedding": [], "rerank": []}<7D>9 -<2D> UAAtest@example.com$2b$12$A9Z7.n1jKQ7bvMXHouVtoOgXHDOWuPVro2T.ZfJxpD66xX1uEiD.KTest User13a9a969-292f-42c5-851d-a58df48004b22026-03-20 15:53:42.2208642026-03-20 15:53:42.220869<EFBFBD>/
/<2F> UAAadmin@example.com$2b$12$WqKmeDZ9qTLCa1QB2qsbUOtdcCR2xgZNegU/WbLQwveYj.SrjF88C3fcb0909-8572-4ce5-8df0-907b0e35915d2026-03-20 14:29:15.9784862026-03-20 14:29:15.978492<EFBFBD>-
+<2B> UAAtest2@jarvis.ai$2b$12$ZPqTr8AOqm.QpMfytzoQB.DgTB1rtN3ZRIrG1tDha5Yi4b1WBBL/a070e4dfd-6d85-4612-9112-ac26cb8ed65f2026-03-20 14:16:22.6961742026-03-20 14:16:22.696178<EFBFBD>5
)<29> UAAtest@jarvis.ai$2b$12$C0l05I4mgGCx3ctCILQVaeeoeExeuupWt4xzv/umqEGwFPMEprU3KTest Usere0f4f3f8-5574-4234-9c47-d87f75a54f6c2026-03-20 14:05:06.2424862026-03-20 14:05:06.242491
4<0F>]4<0F><0F>(U1870bd6c-c88f-480c-95ad-2eb33a1ed3f0(U13a9a969-292f-42c5-851d-a58df48004b2(U3fcb0909-8572-4ce5-8df0-907b0e35915d(U070e4dfd-6d85-4612-9112-ac26cb8ed65f'U e0f4f3f8-5574-4234-9c47-d87f75a54f6c
<0F><0F><0F><0F><0F><0F>/test2@example.com-test@example.com/admin@example.com+test2@jarvis.ai) test@jarvis.ai

项目名称:大模型微调技术研究与应用
申请部门:
起止时间:年至年
项目负责人:
联系电话:
申请日期:年 月
大模型微调技术可行性研究报告
远光软件股份有限公司科技项目可行性研究报告
项目名称: 大模型微调技术研究与应用
申请部门:
起止时间: 年 月至 年 月
项目负责人:
联系电话:
申请日期: 年 月
一、目的和意义
1.1 项目背景与需求
近年来以深度学习为基础的大型预训练语言模型Large Language Models,
LLMs如GPT系列、BERT、LLaMA等在自然语言处理领域取得了突破性进展通过海量数据的预训练和超大规模参数量这些模型展现出强大的通用语言理解与生成能力在机器翻译、文本摘要、问答系统、内容创作等众多任务中表现出色引领了人工智能技术的新浪潮。然而这些通用大模型在面对特定专业领域任务时往往存在知识覆盖不足、专业术语理解偏差、领域特定逻辑推理能力欠缺、输出风格不符合行业特点等问题难以直接满足垂直场景的应用需求。
模型微调Fine-tuning技术作为将通用464f8fd8-ee68-4cd2-9b8a-8ddfa50fbfb22026-03-20 15:36:56.1640942026-03-20 15:37:33.842155<EFBFBD>XU[[}<7D> UAA3fcb0909-8572-4ce5-8df0-907b0e35915d大模型微调技术结项报告_.docx大模型微调技术结项报告_.docxdocx<16><>./data/uploads\973133b8-94ea-498e-95db-cfceec981e09.docx[Word 内容需要安装 python-docx: uv pip install python-docx]180cbfbd-f8c7-4b49-9e60-7ec1a70e8aa32026-03-20 15:36:47.6210792026-03-20 15:36:47.633605
<0F><0F><0F>(U464f8fd8-ee68-4cd2-9b8a-8ddfa50fbfb2'U 180cbfbd-f8c7-4b49-9e60-7ec1a70e8aa3
<0F><0F><0F>(U3fcb0909-8572-4ce5-8df0-907b0e35915d'U 3fcb0909-8572-4ce5-8df0-907b0e35915d
<0F><0F>'U 0933ee84-b878-46d5-9c22-6f6f37458854
<0F><0F>'U 3fcb0909-8572-4ce5-8df0-907b0e35915d
<0F><0F> TODO
]<0F>]<0F><0F>(U268cb16e-c066-4c94-8387-bee75ccdd1bf(Uc88cdec1-8266-44ab-8ea4-2a9ec87f8c41(U225dfa54-f2ff-4e33-93ce-4c8fa5e2fc04'U 863ce86d-ad54-49f9-a8b0-9611248ec9fc
]<0F><0F><0F>](U3fcb0909-8572-4ce5-8df0-907b0e35915d(U3fcb0909-8572-4ce5-8df0-907b0e35915d(U3fcb0909-8572-4ce5-8df0-907b0e35915d'U 3fcb0909-8572-4ce5-8df0-907b0e35915d
<0F><0F><0F><0F>(Uc1312c14-74a4-4d8d-af56-8ca5db40b55d(U1f40d4da-7544-4d5f-b2e1-f104693b5944'U df85840f-8566-46b1-8c7b-9f6914f9e9cb
<0F><0F><0F><0F>(U3fcb0909-8572-4ce5-8df0-907b0e35915d(Ue0f4f3f8-5574-4234-9c47-d87f75a54f6c'U e0f4f3f8-5574-4234-9c47-d87f75a54f6c
Fine-Tuning,
PEFT方法如LoRA、Adapter、Prefix-tuning等技术应运而生为低成本、高效率的大模型领域适配提供了新的技术路径。
本项目旨在探索适合特定领域特点的高效微调策略,解决数据稀缺性、专业术语理解、领域知识融合等关键技术问题,提升模型在特定场景下的准确性、可靠性和实用性。
项目成果将对该现状和技术发展的作用主要体现在技术推动作用和应用落地支撑两方面。
二、国内外研究水平综述
2.1 技术发展历史简要回顾
大模型微调技术的发展历程分为四个阶段43324d55-5216-402d-b218-871ea1b491522026-03-20 15:36:56.2233062026-03-20 15:36:56.223307<EFBFBD>k U<08>UUAA464f8fd8-ee68-4cd2-9b8a-8ddfa50fbfb2远光软件股份有限公司科技项目可行性研究报告
项目名称:大模型微调技术研究与应用
申请部门:
起止时间:年至年
项目负责人:
联系电话:
申请日期:年 月
大模型微调技术可行性研究报告
远光软件股份有限公司科技项目可行性研究报告
项目名称: 大模型微调技术研究与应用
申请部门:
起止时间: 年 月至 年 月
项目负责人:
联系电话:
申请日期: 年 月
一、目的和意义
1.1 项目背景与需求
近年来以深度学习为基础的大型预训练语言模型Large Language Models,
LLMs如GPT系列、BERT、LLaMA等在自然语言处理领域取得了突破性进展通过海量数据的预训练和超大规模参数量这些模型展现出强大的通用语言理解与生成能力在机器翻译、文本摘要、问答系统、内容创作等众多任务中表现出色引领了人工智能技术的新浪潮。然而这些通用大模型在面对特定专业领域任务时往往存在知识覆盖不足、专业术语理解偏差、领域特定逻辑推理能力欠缺、输出风格不符合行业特点等问题难以直接满足垂直场景的应用需求。f9aa3603-f9af-4c07-991b-9b102cf4618e2026-03-20 15:36:56.2232972026-03-20 15:36:56.223301<EFBFBD>H U<08>UAA180cbfbd-f8c7-4b49-9e60-7ec1a70e8aa3[Word 内容需要安装 python-docx: uv pip install python-docx]d31ee8ea-77d5-409a-afa0-0cbc5872ccd82026-03-20 15:36:47.6359092026-03-20 15:36:47.68
 4]<0F><0F> <0F>(Uf01c16f1-4dcc-4cce-93d7-b8a5ae8a60fa(U12a3b425-1eb6-4dca-8e90-ae3891eaa259(U2d7a85e0-2be1-4b26-8aa5-5b4e0409fa0f(U43324d55-5216-402d-b218-871ea1b49152(Uf9aa3603-f9af-4c07-991b-9b102cf4618e'U d31ee8ea-77d5-409a-afa0-0cbc5872ccd8
 <0F><0F><0F>]4 (U464f8fd8-ee68-4cd2-9b8a-8ddfa50fbfb2(U464f8fd8-ee68-4cd2-9b8a-8ddfa50fbfb2(U464f8fd8-ee68-4cd2-9b8a-8ddfa50fbfb2(U464f8fd8-ee68-4cd2-9b8a-8ddfa50fbfb2(U464f8fd8-ee68-4cd2-9b8a-8ddfa50fbfb2'U 180cbfbd-f8c7-4b49-9e60-7ec1a70e8aa3

<EFBFBD><00>w<0F>; <0C><00> <0C>
e<08>
:F<07>*<07><05><04>Q<03>8<03>p33<00>m<01>)tabledocumentsdocumentsCREATE TABLE documents (
user_id VARCHAR(36) NOT NULL,
title VARCHAR(500) NOT NULL,
filename VARCHAR(500) NOT NULL,
file_type VARCHAR(50) NOT NULL,
file_size INTEGER NOT NULL,
file_path VARCHAR(1000) NOT NULL,
summary TEXT,
chunk_count INTEGER,
is_indexed BOOLEAN,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL, folder_id VARCHAR(36),
PRIMARY KEY (id),
FOREIGN KEY(user_id) REFERENCES users (id)
)<29>c<01>%tableusersusersCREATE TABLE users (
email VARCHAR(255) NOT NULL,
hashed_password VARCHAR(255) NOT NULL,
full_name VARCHAR(255),
is_active BOOLEAN NOT NULL,
is_superuser BOOLEAN NOT NULL,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL, llm_config JSON, scheduler_config JSON,
PRIMARY KEY (id)
)r='<01> indexix_conversations_user_idconversationsCREATE INDEX ix_conversations_user_id ON conversations (user_id)9M'indexsqlite_autoindex_conversations_1conversations<12>/''<01>tableconversationsconversationsCREATE TABLE conversations (
user_id VARCHAR(36) NOT NULL,
title VARCHAR(500),
message_count INTEGER,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id),
FOREIGN KEY(user_id) REFERENCES users (id)
)j9#<01>indexix_forum_posts_user_idforum_postsCREATE INDEX ix_forum_posts_user_id ON forum_posts (user_id)<29> ##<01>ktableforum_postsforum_postsCREATE TABLE forum_posts (
user_id VARCHAR(36) NOT NULL,
title VARCHAR(500) NOT NULL,
content TEXT NOT NULL,
category VARCHAR(100),
is_executed BOOLEAN,
execution_result TEXT,
reply_count INTEGER,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id),
FOREIGN KEY(user_id) REFERENCES users (id)
)5I#indexsqlite_autoindex_forum_posts_1forum_postsN +iindexix_tasks_statustasks CREATE INDEX ix_tasks_status ON tasks (status)Q -mindexix_tasks_user_idtasks CREATE INDEX ix_tasks_user_id ON tasks (user_id)<29> <01>tabletaskstasks
CREATE TABLE tasks (
user_id VARCHAR(36) NOT NULL,
title VARCHAR(500) NOT NULL,
description TEXT,
status VARCHAR(11) NOT NULL,
priority VARCHAR(6) NOT NULL,
due_date DATETIME,
completed_at DATETIME,
tags VARCHAR(1000),
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id),
FOREIGN KEY(user_id) REFERENCES users (id)
))
=indexsqlite_autoindex_tasks_1tasks a5}indexix_documents_user_iddocuments CREATE INDEX ix_documents_user_id ON documents (user_id)<0E><01><01>{tabledocumentsdocumentsCREATE TABLE documents (
user_id VARCHAR(36) NOT NULL,
title VARCHAR(500) NOT NULL,
filename VARCHAR(500) NOT NULL,
file_type VARCHAR(50) NOT NULL,
file_size INTEGER NOT NULL,
file_path VARCHAR(1000) NOT NULL,
summary TEXT,
chunk_count INTEGER,
is_indexed BOOLEAN,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id),
FOREIGN KEY(user_id) REFERENCES users (id)
)1Eindexsqlite_autoindex_documents_1documents<08>7<01>ItableagentsagentsCREATE TABLE agents (
name VARCHAR(100) NOT NULL,
role VARCHAR(100) NOT NULL,
description TEXT,
system_prompt TEXT NOT NULL,
is_active BOOLEAN,
is_default BOOLEAN,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id)
)+?indexsqlite_autoindex_agents_1agentsR)sindexix_users_emailusersCREATE UNIQUE INDEX ix_users_email ON users (email)<0F>><01>UtableusersusersCREATE TABLE users (
email VARCHAR(255) NOT NULL,
hashed_password VARCHAR(255) NOT NULL,
full_name VARCHAR(255),
is_active BOOLEAN NOT NULL,
is_superuser BOOLEAN NOT NULL,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id)
))=indexsqlite_autoindex_users_1users t[ <0B>  <09> <09> <08><06><04>V6<03><01>\ <0A> <0B> <00><00>OO?+S-indexsqlite_autoindex_memory_summaries_1memory_summaries.d)7<01>indexix_kg_edges_source_idkg_edges,CREATE INDEX ix_kg_edges_source_id ON kg_edges (source_id)d(7<01>indexix_kg_edges_target_idkg_edges+CREATE INDEX ix_kg_edges_target_id ON kg_edges (target_id)/$Cindexsqlite_autoindex_kg_nodes_1kg_nodes'v"C<01>indexix_messages_conversation_idmessages%CREATE INDEX ix_messages_conversation_id ON messages (conversation_id)<29>l <01>+tablemessagesmessages#CREATE TABLE messages (
conversation_id VARCHAR(36) NOT NULL,
role VARCHAR(20) NOT NULL,
content TEXT NOT NULL,
model VARCHAR(100),
tokens_used INTEGER,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id),
FOREIGN KEY(conversation_id) REFERENCES conversations (id)
) 1Cindexsqlite_autoindex_messages_1messages$<24>O)<01>1indexix_agent_messages_conversation_idagent_messages"CREATE INDEX ix_agent_messages_conversation_id ON agent_messages (conversation_id)yA)<01>indexix_agent_messages_agent_idagent_messages!CREATE INDEX ix_agent_messages_agent_id ON agent_messages (agent_id)<29>"))<01>tableagent_messagesagent_messagesCREATE TABLE agent_messages (
agent_id VARCHAR(36) NOT NULL,
conversation_id VARCHAR(36) NOT NULL,
role VARCHAR(20) NOT NULL,
content TEXT NOT NULL,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id),
FOREIGN KEY(agent_id) REFERENCES agents (id),
FOREIGN KEY(conversation_id) REFERENCES conversations (id)
);O)indexsqlite_autoindex_agent_messages_1agent_messages r='<01> indexix_forum_replies_post_idforum_repliesCREATE INDEX ix_forum_replies_post_id ON forum_replies (post_id)<29>C''<01>Etableforum_repliesforum_repliesCREATE TABLE forum_replies (
post_id VARCHAR(36) NOT NULL,
user_id VARCHAR(36),
agent_id VARCHAR(36),
content TEXT NOT NULL,
is_ai_reply BOOLEAN,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id),
FOREIGN KEY(post_id) REFERENCES forum_posts (id),
FOREIGN KEY(user_id) REFERENCES users (id),
FOREIGN KEY(agent_id) REFERENCES agents (id)
)9M'indexsqlite_autoindex_forum_replies_1forum_replies <0B>v?)<01>indexix_task_histories_task_idtask_historiesCREATE INDEX ix_task_histories_task_id ON task_histories (task_id);O)indexsqlite_autoindex_task_histories_1task_histories<18>G))<01>Itabletask_historiestask_historiesCREATE TABLE task_histories (
task_id VARCHAR(36) NOT NULL,
action VARCHAR(100) NOT NULL,
old_value TEXT,
new_value TEXT,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id),
FOREIGN KEY(task_id) REFERENCES tasks (id)
)<29>I+<01>%indexix_document_chunks_document_iddocument_chunksCREATE INDEX ix_document_chunks_document_id ON document_chunks (document_id)=Q+indexsqlite_autoindex_document_chunks_1document_chunks<02>++<01>{tab<61>&<01>tablekg_edgeskg_edges)CREATE TABLE kg_edges (
source_id VARCHAR(36) NOT NULL,
target_id VARCHAR(36) NOT NULL,
relation_type VARCHAR(100) NOT NULL,
weight FLOAT,
properties_ JSON,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id),
FOREIGN KEY(source_id) REFERENCES kg_nodes (id),
FOREIGN KEY(target_id) REFERENCES kg_nodes (id)
)<02>Cindexsqlite_autoindex_kg_edges_1kg_edges*]%3yindexix_kg_nodes_user_idkg_nodes(CREATE INDEX ix_kg_nodes_user_id ON kg_nodes (user_id)<29>n#<01>/tablekg_nodeskg_nodes&CREATE TABLE kg_nodes (
user_id VARCHAR(36)<29>"++<01>{tabledocument_chunksdocument_chunksCREATE TABLE document_chunks (
document_id VARCHAR(36) NOT NULL,
chunk_index INTEGER NOT NULL,
content TEXT NOT NULL,
metadata_ VARCHAR(2000),
chroma_collection VARCHAR(255),
chroma_id VARCHAR(255),
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id),
FOREIGN KEY(document_id) REFERENCES documents (id)
)






U<1F>MUAA1f40d4da-7544-4d5f-b2e1-f104693b5944assistant抱歉发生错误: Error code: 401 - {'error': {'message': 'Incorrect API key provided: sk-your-***************here. You can find your API key at https://platform.openai.com/account/api-keys.', 'type': 'invalid_request_error', 'code': 'invalid_api_key', 'param': None}, 'status': 401}jarvis352bd907-54de-4b37-a2c2-0d6c771994d12026-03-20 14:16:26.1673772026-03-20 14:16:26.167381<EFBFBD> UUAA1f40d4da-7544-4d5f-b2e1-f104693b5944userhellob85dd235-2383-49fd-9a71-6fcb297aabee2026-03-20 14:16:23.7716972026-03-20 14:16:23.771698<EFBFBD> U%UAAdf85840f-8566-46b1-8c7b-9f6914f9e9cbuserhello jarvis953f6db2-6793-433f-b49b-400b584bc98b2026-03-20 14:05:47.9216302026-03-20 14:05:47.921633
]<0F>]<0F><0F>(U4fbe833f-022b-41e1-921a-016d425c6b8b(U352bd907-54de-4b37-a2c2-0d6c771994d1(Ub85dd235-2383-49fd-9a71-6fcb297aabee'U 953f6db2-6793-433f-b49b-400b584bc98b
]<0F><0F>]<0F>(Uc1312c14-74a4-4d8d-af56-8ca5db40b55d(U1f40d4da-7544-4d5f-b2e1-f104693b5944(U1f40d4da-7544-4d5f-b2e1-f104693b5944'U df85840f-8566-46b1-8c7b-9f6914f9e9cb






<EFBFBD>
>x7<07><04><06>}<02>F7B<00>C4<01>]tablefoldersfolders:CREATE TABLE folders (
id VARCHAR(36) PRIMARY KEY,
name VARCHAR(255) NOT NULL,
parent_id VARCHAR(36),
user_id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
FOREIGN KEY (parent_id) REFERENCES folders(id),
FOREIGN KEY (user_id) REFERENCES users(id)
)-5Aindexsqlite_autoindex_folders_1folders;j39#<01>indexix_daily_todos_user_iddaily_todos7CREATE INDEX ix_daily_todos_user_id ON daily_todos (user_id)<29> 1##<01>tabledaily_todosdaily_todos5CREATE TABLE daily_todos (
user_id VARCHAR(36) NOT NULL,
title VARCHAR(500) NOT NULL,
is_completed BOOLEAN NOT NULL,
source VARCHAR(9) NOT NULL,
source_detail VARCHAR(500),
source_ref_id VARCHAR(36),
todo_date VARCHAR(10) NOT NULL,
completed_at DATETIME,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id)
)52I#indexsqlite_autoindex_daily_todos_1daily_todos6r0='<01> indexix_user_memories_user_iduser_memories4CREATE INDEX ix_user_memories_user_id ON user_memories (user_id)<29>g.''<01> tableuser_memoriesuser_memories2CREATE TABLE user_memories (
user_id VARCHAR(36) NOT NULL,
memory_type VARCHAR(50) NOT NULL,
content TEXT NOT NULL,
importance INTEGER,
is_recalled BOOLEAN,
recall_count INTEGER,
source_conversation_id VARCHAR(36),
extracted_at DATETIME NOT NULL,
last_recalled_at DATETIME,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id),
FOREIGN KEY(user_id) REFERENCES users (id)
)9/M'indexsqlite_autoindex_user_memories_1user_memories3~-C-<01>indexix_memory_summaries_user_idmemory_summaries1CREATE INDEX ix_memory_summaries_user_id ON memory_summaries (user_id)<29>,S-<01>9indexix_memory_summaries_conversation_idmemory_summaries0CREATE INDEX ix_memory_summaries_conversation_id ON memory_summaries (conversation_id)?+S-indexsqlite_autoindex_memory_summaries_1memory_summaries.<2E>C*--<01>9tablememory_summariesmemory_summaries-CREATE TABLE memory_summaries (
user_id VARCHAR(36) NOT NULL,
conversation_id VARCHAR(36) NOT NULL,
summary_text TEXT NOT NULL,
turn_count INTEGER,
summary_at DATETIME NOT NULL,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id),
FOREIGN KEY(user_id) REFERENCES users (id),
FOREIGN KEY(conversation_id) REFERENCES conversations (id)
)d)7<01>indexix_kg_edges_source_idkg_edges,CREATE INDEX ix_kg_edges_source_id ON kg_edges (source_id)d(7<01>indexix_kg_edges_target_idkg_edges+CREATE INDEX ix_kg_edges_target_id ON kg_edges (target_id)/'Cindexsqlite_autoindex_kg_edges_1kg_edges*<2A>&<01>tablekg_edgeskg_edges)CREATE TABLE kg_edges (
source_id VARCHAR(36) NOT NULL,
target_id VARCHAR(36) NOT NULL,
relation_type VARCHAR(100) NOT NULL,
weight FLOAT,
properties_ JSON,
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id),
FOREIGN KEY(source_id) REFERENCES kg_nodes (id),
FOREIGN KEY(target_id) REFERENCES kg_nodes (id)
)]%3yindexix_kg_nodes_user_idkg_nodes(CREATE INDEX ix_kg_nodes_user_id ON kg_nodes (user_id)/$Cindexsqlite_autoindex_kg_nodes_1kg_nodes'<27>n#<01>/tablekg_nodeskg_nodes&CREATE TABLE kg_nodes (
user_id VARCHAR(36) NOT NULL,
name VARCHAR(500) NOT NULL,
entity_type VARCHAR(100) NOT NULL,
description TEXT,
properties_ JSON,
source_document_id VARCHAR(36),
importance FLOAT,
last_updated_by VARCHAR(36),
id VARCHAR(36) NOT NULL,
created_at DATETIME NOT NULL,
updated_at DATETIME NOT NULL,
PRIMARY KEY (id),
FOREIGN KEY(user_id) REFERENCES users (id),
FOREIGN KEY(source_document_id) REFERENCES documents (id)
)v"C<01>indexix_messages_conversation_idmessages%CREATE INDEX ix_messages_conversation_id ON messages (conversation_id)/!Cindexsqlite_autoindex_messages_1messages$




<0F><0F><0F>(U37c9c122-56c7-4570-85f3-98a282c66122'U 5965a308-567e-4ea4-8f8a-ea9782831212
<0F><0F><0F>(U3fcb0909-8572-4ce5-8df0-907b0e35915d'U 3fcb0909-8572-4ce5-8df0-907b0e35915d
Fine-Tuning,
PEFT方法如LoRA、Adapter、Prefix-tuning等技术应运而生为低成本、高效率的大模型领域适配提供了新的技术路径。
本项目旨在探索适合特定领域特点的高效微调策略,解决数据稀缺性、专业术语理解、领域知识融合等关键技术问题,提升模型在特定场景下的准确性、可靠性和实用性。
项目成果将对该现状和技术发展的作用主要体现在技术推动作用和应用落地支撑两方面。
二、国内外研究水平综述
2.1 技术发展历史简要回顾
大模型微调技术的发展历程分为四个阶段43324d55-5216-402d-b218-871ea1b491522026-03-20 15:36:56.2233062026-03-20 15:36:56.223307<EFBFBD>k U<08>UUAA464f8fd8-ee68-4cd2-9b8a-8ddfa50fbfb2远光软件股份有限公司科技项目可行性研究报告
项目名称:大模型微调技术研究与应用
申请部门:
起止时间:年至年
项目负责人:
联系电话:
申请日期:年 月
大模型微调技术可行性研究报告
远光软件股份有限公司科技项目可行性研究报告
项目名称: 大模型微调技术研究与应用
申请部门:
起止时间: 年 月至 年 月
项目负责人:
联系电话:
申请日期: 年 月
一、目的和意义
1.1 项目背景与需求
近年来以深度学习为基础的大型预训练语言模型Large Language Models,
LLMs如GPT系列、BERT、LLaMA等在自然语言处理领域取得了突破性进展通过海量数据的预训练和超大规模参数量这些模型展现出强大的通用语言理解与生成能力在机器翻译、文本摘要、问答系统、内容创作等众多任务中表现出色引领了人工智能技术的新浪潮。然而这些通用大模型在面对特定专业领域任务时往往存在知识覆盖不足、专业术语理解偏差、领域特定逻辑推理能力欠缺、输出风格不符合行业特点等问题难以直接满足垂直场景的应用需求。f9aa3603-f9af-4c07-991b-9b102cf4618e2026-03-20 15:36:56.2232972026-03-20 15:36:56.223301<EFBFBD>H U<08>UAA180cbfbd-f8c7-4b49-9e60-7ec1a70e8aa3[Word 内容需要安装 python-docx: uv pip install python-docx]d31ee8ea-77d5-409a-afa0-0cbc5872ccd82026-03-20 15:36:47.6359092026-03-20 15:36:47.635912 <00>
<EFBFBD><04><00><00>j U<01>QUAA464f8fd8-ee68-4cd2-9b8a-8ddfa50fbfb2六、项目承担团队的条件
项目团队具备人工智能、大数据等领域的技术背景具备财务信息系统开发经验具备充足的GPU计算资源和完善的开发测试环境。
七、项目进度安排
第1-2月项目启动、需求分析第3-4月数据收集、清洗第5-7月数据集生成第8-10月模型训练第11-12月系统开发第13-14月优化整理第15-16月验收转化。
八、项目经费预算
本项目经费预算根据实际研究工作需要编制,包括人工费、设备使用费、业务费、场地使用费、专家咨询费等科目。
分管领导审核意见:
(对经费预算是否合理,有无其他经费来源,能否保证研究计划实施所需的人力,工作时间等基本条件提出具体意见)
分管领导(签字): 年 月 日f01c16f1-4dcc-4cce-93d7-b8a5ae8a60fa2026-03-20 15:36:56.2233182026-03-20 15:36:56.223319<EFBFBD>P U<01>UAA464f8fd8-ee68-4cd2-9b8a-8ddfa50fbfb23.2 项目研究内容理论和实践依据
理论依据包括国家战略层面的政策支持和成熟的技术理论体系。实践依据包括大模型微调技术在财务等垂直领域的成功案例。
3.3 项目研究的关键和难点
关键点包括高质量数据集构建、高效微调策略适配、知识精准注入与幻觉抑制、效果评估体系建设。难点集中在数据处理、微调策略、知识注入和评估体系四个方面。
四、项目研究内容和实施方案
4.1 项目研究内容详细说明
本项目研究内容包括数据格式研究、微调框架研究、模型微调后评估体系研究三个方面。
4.2 理论研究步骤和试验计划
包括数据处理流程、训练数据生成流程、数据验证流程三个主要环节。
4.3 项目组织方式和协作分工
本项目由项目负责人统筹协调,下设数据组、算法组、应用组三个工作小组。
五、预期目标和成果形式
5.1 项目研究预期达到的目标
技术目标问答准确率达到85%以上。应用目标开发财务智能知识问答原型系统。效益目标替代财务专家70%以上的重复性咨询工作。
5.2 明确叙述提高研究成果的形式
包括技术方案文档、原型系统、训练数据集、微调模型、技术论文/报告等成果形式。12a3b425-1eb6-4dca-8e90-ae3891eaa2592026-03-20 15:36:56.2233142026-03-20 15:36:56.223315<EFBFBD>] U<01>7UAA464f8fd8-ee68-4cd2-9b8a-8ddfa50fbfb2第一阶段2018年前传统迁移学习与微调雏形阶段。模型适配多采用传统迁移学习思路将通用数据集上训练的基础模型迁移至特定任务场景。
第二阶段2018-2020年预训练-微调范式确立阶段。2018年谷歌提出BERT模型首次构建"预训练通用知识+下游任务微调"的技术框架。
第三阶段2020-2022年高效微调技术爆发阶段。LoRA、QLoRA、Adapter等参数高效微调技术相继出现将微调参数规模大幅降低。
第四阶段2022年至今垂直领域深化与协同优化阶段。"基座模型+领域微调"的架构成为主流,微调技术与知识图谱进一步融合。
2.2 国内外研究水平现状和发展趋势
国际层面Hugging
Face、DeepSpeed等开源社区为参数高效微调技术的普及提供了重要支撑。国内层面阿里云基于通义千问进行财税领域定制微调验证了微调技术在财务领域的应用价值。
三、项目的理论和实践依据
3.1 项目研究内容原理简述
本项目采用"基座模型+领域适配"分层微调架构选取开源基座模型针对财务问答场景特性采用LoRA参数高效微调策略。2d7a85e0-2be1-4b26-8aa5-5b4e0409fa0f2026-03-20 15:36:56.2233102026-03-20 15:36:56.223311