ChatGPT,学名全称:聊天生成预训练转换器(英語:Chat Generative Pre-trained Transformer),是OpenAI 开发的人工智能聊天机器人程序,于2022年11月推出。近几个月来,像ChatGPT这样的人工智能聊天机器人吸引了全世界的注意力,因为它们能够以类似人类的方式就几乎任何话题进行有效的交流。
它就像一个超级聪明的AI聊天机器人,似乎无所不知。它可以做任何事情,从你的家庭作业,到写一封求职信,再到编程代码、撰写文章、回答问题,等等。根据测试,回答问题的水平高于常人测试者。
许多人自然会问,像ChatGPT这样的人工智能聊天机器人,到底是如何工作的呢?这里,我们尽量用通俗的语言给予简单、基本的解释。
我们许多人知道互联网搜索引擎,如谷歌、百度等,能够进行大量的数据库查找,并提供一系列可能会回答你查询的匹配项。ChatGPT的强大功能在于能够根据其接受过训练的大量文本数据生成所谓的语料库,用以解释特定查询的上下文和含义,并以语法正确的自然语言生成相关答案,从而有了上述的应用。
那么,它具体是怎样工作的呢?
首先,需要搞清的是,它不是先知先觉,它本身不会自动变得聪明,它不能像人类那样灵活地学习新东西,它从被告知要学习的任何内容中学习。它本身是有一个知识库,并用它来回答你的问题。
这个知识库接受了来自书籍、互联网络、新闻文章、小说、科技论文期刊及其他数据,以用于训练它。这些训练材料的日期至今收集到大约2021年9月为此。也就是说,在此以后任何更新的信息,比方说对于最近这几个月,最近这几周、或最近这几天的新信息等,它都一无所知。如果想得到这种新的答案,必须教会它这些新的信息材料。
如果用一句话来简单概括它的工作原理就是,通过大规模训练人工智能神经网络来学习语言模型,然后使用这个语言模型来生成自然流畅的文本或完成其他自然语言处理任务。
如果再用稍稍专业的语言来描述是:ChatGPT是一种基于深度学习技术的自然语言处理模型,其基本原理是利用神经网络模拟人类的语言处理能力。ChatGPT的核心组成部分是一个很深的多层神经网络,这个神经网络使用了一种称为“Transformer”(转换器)的架构。这个架构允许模型同时处理多个输入,并能够注意到输入之间的关联性。
上面的工作原理的定义是什么意思?首先,我们最简单地来看看ChatGPT是怎么做的,然后再进一步地解释这一点。
例如我现在向它输入一个问题,“用非常简单的术语两句话解释量子力学”。ChatGPT 的实际输出是这样的:“量子力学是一种研究微观世界(比如原子、分子、粒子)的物理学理论,它描述了微观粒子的行为和相互作用,包括波粒二象性、不确定性原理等。”
一般来讲,这个答案不错。那么,它是怎么想到这个答案的呢?
它所做的基本上是估计哪些单词、短语和句子可能与我刚刚输入的内容相关联,然后它会选择它认为最有可能与输入相关联的单词和句子。
因此,它会尝试理解你的提示,然后根据它所训练的数据输出它预测最能回答你问题的单词和句子。它还会随机化一些输出,以便你针对相同输入获得的答案通常会有所不同。因此,例如,当我要求它重新生成对应于之前相同的问题的响应时,我们会得到这个答案:
“量子力学是一种研究微观世界中粒子运动的科学,它描述了微观粒子(如原子、分子、电子等)的行为和性质,其中最重要的概念是“波粒二象性”和“量子叠加态”。”
一般来说,这也是一个很好的答案。我们现在进一步地来看看它,在这个背后具体发生了些什么?
关于ChatGPT的基本工作原理需要了解的第一件事是,它首先是在试图了解你的输入,与数十亿页的网页、书籍和其他数据上的文字进行比较,然后试图确定最有可能出现的词语。这是一个受过训练的、巨大的数据集,形成为一个深度学习神经网络。
简而言之,这是一种多层加权算法,类似于我们所认知的人脑的工作方式,使它能够学习文本数据中的模式和关系。它利用这种学习的一种方式,是通过预估任何给定句子中的下一个文本,来创建类似人类的响应。
我们常常在手机上打字时,手机会自动提示你一个可能即将要打出的一个词。像ChatGPT这样的人工智能聊天机器人,会自动提示的不仅是一个词,而是一个句子以及整个段落。它试图创建的是完全连贯的句子及其段落作为对任何输入的响应。
有人可能又会问,这是如何具体做到的呢?我们举一个简单例子来说明。假设我们向它提出这样一个非完整问题,“量子力学是……”。在它的背后所发生的处理过程是这样的。它根据该文本中的所有实例元素计算下一个词是什么,以及出现的时间是多少。
它不是从字面上看文本,而是从上下文和含义中寻找匹配项。结果是它会生成一个可能跟在后面的单词的排名列表,以及它们的“概率”。例如,在编写“量子力学是….”的后面,它可能会选择下一个这样的不同的输出单词:
它会根据概率及内置随机性选择输出完全不同、同时又较为自然连贯的词语所组成的答案。比如说对于我关于我们上面的问题,它的回答过程是:
-
量子力学是 -
量子力学是一门 -
量子力学是一门研究 -
量子力学是一门研究微观世界 -
量子力学是一门研究微观世界的物理学科,
没有回复内容