ChatGPT技术原理解析:从RL之PPO算法、RLHF到GPT4、instructGPT

sockstack / 215 / 2023-11-09 13:02:11


ChatGPT技术原理解析:从RL之PPO算法、RLHF到GPT4、instructGPT
作者
sockstack
许可协议
CC BY 4.0
发布于
2023-11-09
修改于
2025-05-05
Bonnie image
尚未登录