ChatGPT的发展背景

ChatGPT的发展背景

ChatGPT是一个可以对话的方式进行交互的模型，因为它的智能化，得到了很多用户的欢迎。Generative Pre-trained Transformer (GPT)，是一种基于互联网可用数据训练的文本生成深度学习模型。它用于问答、文本摘要生成、机器翻译、分类、代码生成和对话 AI。
总体来说GPT截至目前的整个发展史，分以下几次迭代：

第一次迭代：GPT-1的诞生

2018年，GPT-1诞生，这一年也是NLP（自然语言处理）的预训练模型元年。性能方面，GPT-1有着一定的泛化能力，能够用于和监督任务无关的NLP任务中。其常用任务包括：
• 自然语言推理：判断两个句子的关系（包含、矛盾、中立）
• 问答与常识推理：输入文章及若干答案，输出答案的准确率
• 语义相似度识别：判断两个句子语义是否相关
• 分类：判断输入文本是指定的哪个类别
虽然GPT-1在未经调试的任务上有一些效果，但其泛化能力远低于经过微调的有监督任务，因此GPT-1只能算得上一个还算不错的语言理解工具而非对话式AI。

第二次迭代：GPT-2的成长

GPT-2也于2019年如期而至，不过，GPT-2并没有对原有的网络进行过多的结构创新与设计，只使用了更多的网络参数与更大的数据集：最大模型共计48层，参数量达15亿，学习目标则使用无监督预训练模型做有监督任务。
在性能方面，除了理解能力外，GPT-2在生成方面第一次表现出了强大的天赋：阅读摘要、聊天、续写、编故事，甚至生成假新闻、钓鱼邮件或在网上进行角色扮演通通不在话下。
在“变得更大”之后，GPT-2的确展现出了普适而强大的能力，并在多个特定的语言建模任务上实现了彼时的最佳性能。

第三次迭代：GPT-3的升级

GPT-3出现了，作为一个无监督模型（现在经常被称为自监督模型），几乎可以完成自然语言处理的绝大部分任务，例如面向问题的搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等等。
该模型在诸多任务上表现卓越，例如在法语-英语和德语-英语机器翻译任务上达到当前最佳水平，自动产生的文章几乎让人无法辨别出自人还是机器（仅52%的正确率，与随机猜测相当），更令人惊讶的是在两位数的加减运算任务上达到几乎100%的正确率，甚至还可以依据任务描述自动生成代码。一个无监督模型功能多效果好，似乎让人们看到了通用人工智能的希望，可能这就是GPT-3影响如此之大的主要原因。

第四次迭代：ChatGPT的爆炸

有一个让人震惊的江湖传言：GPT4据称通过了图灵测试！
图灵测试究竟是什么意思？简单的说，就是隔着一个小黑屋问各种话题，然后是否能分辨小黑屋里回答问题的究竟是机器还是人类。如果无法辨别，就说明了机器具有和人一样等级的智能，通过了图灵测试。迄今为止，还没有AI模型能真正通过图灵测试。谁知道，还没等来GPT4，衍生自GPT3.5的ChatGPT却先来了。
目前来看：ChatGPT仍有一些缺点，但这都只是战术级别的；在战略上，ChatGPT的前景已经相当令人期待，特别是OpenAI下一代GPT4加持下的ChatGPT，其能力恐怕更加突破天际~

注：上文主要参考以下文章：
1.GPT4发布在即堪比人脑，多位圈内大佬坐不住了！-徐杰承、云昭 -公众号51CTO技术栈- 2022-11-24 18:08
2.一文解答你对GPT-3的好奇！GPT-3是什么？为何说它如此优秀？-张家俊中国科学院自动化研究所 2020-11-11 17:25 发表于北京
3.The Batch: 329 | InstructGPT，一种更友善、更温和的语言模型-公众号DeeplearningAI-2022-02-07 12:30
4.微信公众号：Web3天空之城（ID：Web3SkyCity），作者：城主，原文标题：《从爆火的ChatGPT讲起：自然语言生成式AI的前世今生，你想了解的一切》

作者：小往大来710
文章来源：https://zhuanlan.zhihu.com/p/609866646

袁锐钦的AIGC知识库

ChatGPT的发展与背景

ChatGPT的发展背景

第一次迭代：GPT-1的诞生

第二次迭代：GPT-2的成长

第三次迭代：GPT-3的升级

第四次迭代：ChatGPT的爆炸