ChatGPT技术原理解析:从RL之PPO算法、RLHF到GPT4、instructGPT

sockstack / 331 / 2023-11-09 00:02:11


ChatGPT技术原理解析:从RL之PPO算法、RLHF到GPT4、instructGPT
作者
sockstack
许可协议
CC BY 4.0
发布于
2023-11-09
修改于
2024-12-22
Bonnie image
尚未登录