模型调优 / 创建训练任务

基本信息

0 / 50

0 / 200

训练配置

正在加载GPU设备...

支持选择多个GPU进行训练(多卡训练)

SFT 微调训练
在监督指令下,增强模型指令跟随的能力,提升全参数微调训练方式
DPO 偏好训练
引入人类反馈,降低幻觉,使得模型输出更符合人类偏好
CPT 继续预训练
通过无标注数据进行无监督继续训练,强化或新增模型特定能力

选择与您的模型匹配的对话模板,确保训练数据格式正确

参数名称 参数值 取值范围 参数说明
batch_size * [1, 64] 单步训练样本数量,数值越大训练速度越快,但显存占用越高
learning_rate * [0.000001, 1] 模型参数更新步长,过大可能导致训练不稳定,过小收敛速度慢
n_epochs * [1, 100] 完整遍历训练数据集的次数,建议设置在1-10之间
save_steps * [10, 10000] 每训练多少步进行一次模型保存,建议设置为100的倍数
lr_scheduler_type 3种可选 学习率变化策略,cosine为余弦退火,linear为线性下降,constant为保持不变
max_length * [64, 4096] 单条训练数据的最大token数,超出部分将被截断
warmup_ratio [0, 1] 学习率预热步数占总步数的比例,设置为0则不预热
weight_decay [0, 1] 防止过拟合的正则化技术,值越大对模型参数约束越强

数据配置

训练产出

训练完成后,模型将保存为: 任务名称

训练命令预览
请选择完整配置后查看预览命令
取消