《Fine-Tuning Language Models from Human Preferences》
URL:http://arxiv.org/abs/1909.08593
Official Code:
泛化性更好的实现:trl
单位:OpenAI
参考
文档信息
- 本文作者:Bookstall
- 本文链接:https://bookstall.github.io/2023/03/15/Fine-Tuning-Language-Models-from-Human-Preferences/
- 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)