经过OpenAI的测试,到目前为止已经看到偏好微调方法取得的可喜效果。据悉,Rogo AI正在为金融分析师打造一款人工智能助手,可将复杂查询分解为子查询。他们使用专家构建的基准Rogo-Golden发现,虽然监督微调面临着分布外查询扩展的挑战,例如在查询 “X公司的增长速度有多快 ”时缺少ARR等指标,但偏好微调解决了这些问题,将基本模型的准确率从75%提高到80%以上。