ChatGPT最初是2022年11月30日由OpenAI开发并推出的聊天机器人,是基于 GPT-3.5 架构的大型语言模型并通过强化学习进行训练。除了可以以文字方式与用户进行互动,还可以用于相对复杂的语言工作,包括自动文本生成、自动问答等功能,还具有编写和调试计算机程序,创作文本、故事的能力。
在ChatGPT成型之前,GPT技术经历了多次技术上的迭代,体现在模型层次结构的增加以及参数量的增加,涉及到主要的公司为谷歌和OpenAI两家大厂,其中InstructGPT的诞生可以说属于发展过程中的大跨越,加入了指令微调 ( Prompt tuning )和 RLHF(Reinforcement Learning from Human Feedback) 人类反馈强化学习技术,使得输出结果更加符合人类偏好。具体可见下表:
数据来源:OpenAI官网,信达证券研报,Choice数据