《ChatGPT的技术发展路径和带来的影响》(附PDF下载)


报告节选

InstructGPT/ChatGPT的效果非常亮眼,引入了人工标注之后,让模型的“价值观”和的正确程度和人类行为模式的“真实性”上都大幅的提升。

模型优点

真实性&无害性

InstructGPT/ChatGPT引入了不同的labeler进行提示编写和生成结果排序,并且还是在GPT-3之上进行的微调,这使得我们在训练奖励模型时对

更加真实无害的数据会有更高的奖励。

无害性

GPT-3就具有很强的Coding能力,基于GPT-3制作的API也积累了大量的Coding代码。而且也有部分OpenAI的内部员工参与了数据采集工作。

通过Coding相关的大量数据以及人工标注,训练出来的InstructGPT/ChatGPT具有非常强的Coding能力也就不意外了。

切题性

无论回答是否正确真实,但是基本都能做到切题,这说明ChatGPT在理解人类语言上已经非常成功。

存在问题

过分解读

因为labeler在进行生成内容的比较时,倾向于给给长的输出内容更高的奖励。

容易被诱导

对有害的指示可能会输出有害的答复:例如InstructGPT/ChatGPT也会对用户提出的“AI毁灭人类计划书”给出行动方案。

GPT-3就具有很强的Coding能力,基于GPT-3制作的API也积累了大量的Coding代码。而且也有部分OpenAI的内部员工参与了数据采集工作。

通过Coding相关的大量数据以及人工标注,训练出来的InstructGPT/ChatGPT具有非常强的Coding能力也就不意外了。

荒谬性

很有可能受限于纠正数据的有限,或是有监督任务的误导,导致它生成内容的不真实。

ChatGPT的技术发展路径和带来的影响.pdf
1.86M

特别声明:1、以上内容仅代表原作者观点;2、以上内容(包括资讯和下载资源等)由吾爱元宇宙提供免费获取方式,仅供用户学习使用,如需商用请联系原作者;3、如需转载以上内容请保留原始出处并提供链接通道;4、如以上内容侵犯了原作者的版权、著作权、肖像权等权利,请联系:admin@5imetaverse.com,我们会尽快核实处理。

评论列表 0

暂无评论