ChatGPT 中的人类反馈强化学习 (RLHF) 实战

sockstack / 1322 / 2024-02-28 00:02:38


ChatGPT 中的人类反馈强化学习 (RLHF) 实战
作者
sockstack
许可协议
CC BY 4.0
发布于
2024-02-28
修改于
2024-12-27
Bonnie image
尚未登录