用于 AI 助手和主业务排队调度的默认模型接入。
主模型不可用或限频时用于兜底切换的备用模型接入。
用于向量检索、知识库召回和语义匹配的嵌入模型设置。
用于检索结果重排和语义精排的 Reranker 模型设置。