我理解的就是和标注工差不多,给数据标注,训练类chatGPT的模型的。chatGPT带火一个概念就是语义对齐,其目的想要生成符合人类理解的3H输出,需要结合人工反馈来强化训练模型。

相关推荐

想run的马里奥在学...:这个学历帮你扫平百分之80的障碍,投就完了,这会找不到就等3月暑期一样能找到
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务