1987WEB视界-分享互联网热门产品和行业

您现在的位置是:首页 > 人工智能AI > 正文

人工智能AI

ChatGPT使用指南

1987web2023-03-22人工智能AI337
前言:ChatGPT让人看到了人类友好型对话的最先进水平,在此基础上将萌发出广泛的商业应用,它会渗透到各行各业。可能会让AI系统提前到来。本文做相应简单的原理介绍以及使用方法与相应惊艳的效果展示。

前言:ChatGPT让人看到了人类友好型对话的最先进水平,在此基础上将萌发出广泛的商业应用,它会渗透到各行各业。可能会让AI系统提前到来。本文做相应简单的原理介绍以及使用方法与相应惊艳的效果展示。

OPENAI.jpg

OPENAI

一、背景

✨✨这里我就直接贴上跟ChatGPT的对话作为背景输入,说真的,它的回答太专业了,具体见如下截图:

这里我就直接贴上跟ChatGPT的对话作为背景输入.jpg

背景介绍

背景介绍.jpg

技术介绍

技术介绍.jpg

典型应用

二、原理

⚡从官网介绍查看链接可以看到,ChatGPT与InstructGPT是同源的模型。那么接下来我们来看下什么是InstructGPT。从官网介绍可以看到,ChatGPT与InstructGPT是同源的模型。那么接下来我们来看下什么是InstructGPT。从字面上来看,顾名思义,它就是指令式的GPT,which is trained to follow an instruction in a prompt and provide a detailed response。接下来我们来看下InstructGPT论文[1]中的主要原理:

我们来看下InstructGPT论文[1]中的主要原理.jpg

原理

从该图可以看出,InstructGPT是基于GPT-3模型训练出来的,具体步骤如下:

从GPT-3的输入语句数据集中采样部分输入,基于这些输入,采用人工标注完成希望得到输出结果与行为,然后利用这些标注数据进行GPT-3有监督的训练。该模型即作为指令式GPT的冷启动模型。在采样的输入语句中,进行前向推理获得多个模型输出结果,通过人工标注进行这些输出结果的排序打标。最终这些标注数据用来训练reward反馈模型。采样新的输入语句,policy策略网络生成输出结果,然后通过reward反馈模型计算反馈,该反馈回过头来作用于policy策略网络。以此反复,这里就是标准的reinforcement learning强化学习的训练框架了。

所以总结起来ChatGPT(对话GPT)其实就是InstructGPT(指令式GPT)的同源模型,然后指令式GPT就是基于GPT-3,先通过人工标注方式训练出强化学习的冷启动模型与reward反馈模型,最后通过强化学习的方式学习出对话友好型的ChatGPT模型。如下是论文中相应对话友好型的定量结果(其中PPO-ptx曲线就是InstructGPT模型),可以看到在回答友好型上InstructGPT是远超原始GPT的:

看到在回答友好型上InstructGPT是远超原始GPT的.jpg

Modl size

三、应用

写书信(情书),一个字绝!

写书信(情书),一个字绝!.jpg

写情书

正如ChatGPT自己回答的那样,它非常擅长对话、情感分析、文本生成、摘要提取等,有了这些直接打开了更广阔的应用面。可想而知,如若在垂直领域做定向训练,它将会发挥出更极致的性能,即可作咨询用途,同时也可以辅助创作(这将颠覆很多行业的工作方式)等等。写论文《使用ChatGPT帮我们写一篇论文,最后查重的重复率会是多少?》查看链接

使用ChatGPT帮我们写一篇论文,最后查重的重复率会是多少?.jpg

查重率报告

即使ChatGPT尽可能生成独特的文本,你最终提交的论文可能与其他文本相似或重复,特别是如果复制粘贴了其他来源的文本。因此,建议在提交论文之前,使用专业的查重工具进行检查,以确保论文没有不当的抄袭或重复。☔☔写代码

写代码.jpg

写代码

chatGPT代码写的有点好啊,程序员要失业了?问题咨询

chatGPT代码写的有点好啊,程序员要失业了.jpg

问题咨询

☔他的回答甚至像一位心理医生。

四、试用

步骤1:网络准备由于内容规定,这里不作过多介绍。步骤2:国外手机准备✈️推荐优先找国外的亲朋好友去要,这里只需要在OpenAI账号注册的时候需要用到,获取相应验证码就行。后续登陆OpenAI不需要相应手机,只需要记住相应注册的账号与密码即可。如果实在没办法找到相应亲朋好友手机号的话,可以通过其他方式购买相应的国外手机号。步骤3:开始账号注册首先打开步骤1网络,其次打开OpenAI账号注册链接查看链接,然后开始相应账号注册,推荐注册gmail邮箱,很多类似的跟gmail邮箱基本都有打通账号体系。完成注册后,最后一步会需要手机验证码,这一步就用到了步骤2中准备好的内容了。直到这里就完成了相应注册了。️️步骤4:开启试用之旅☁️ChatGPT,在如下红框中输入文本内容,就能与ChatGPT交互体验了。

就能与ChatGPT交互体验了.jpg

开始试用