上一步
退出登录
模型评测
/
添加维度
基本信息
维度名称
*
0
/ 50
指标类型
*
请选择指标类型
大模型评估-分类型
大模型评估-指标型
规则评估-文本相似度
描述
0
/ 200
计算配置
选择大模型
*
请选择评估使用的大模型
GPT-4
Claude-3
文心一言
通义千问
ChatGLM
评估方式
*
评估 Prompt
*
恢复默认 Prompt
定义大模型评估时使用的提示词,支持 Markdown 语法
BLEU n-gram 范围
1-4 (标准)
1-3
1-2
2-4
3-4
仅 4
计算精度时使用的 N-gram 范围
输出精度
4 位小数 (0.0000)
3 位小数 (0.000)
2 位小数 (0.00)
1 位小数 (0.0)
分数显示保留的小数位数
评分范围
最小分数
-
最大分数
通过阈值
评分大于等于此值视为通过
状态设置
启用该维度
设为默认评测维度
保存维度
取消