ChatGPT技术原理解析:从RL之PPO算法、RLHF到GPT4、instructGPT

sockstack / 163 / 2023-11-09 13:02:11


ChatGPT技术原理解析:从RL之PPO算法、RLHF到GPT4、instructGPT
作者
sockstack
许可协议
CC BY 4.0
发布于
2023-11-09
修改于
2024-05-08
Bonnie image
尚未登录