GPT-4重磅发布!ChatGPT炸裂大升级,能考上哈佛,体验后我慌了
今天 OpenAI 宣布推出 ChatGPT 4,ChatGPT Plus 用户在今天就能体验到。
OpenAI 称它是「最先进的系统,能生产更安全和更有用的回复」。
和上一代相比,GPT-4 拥有了更广的知识面和更强的解决问题能力,在创意、视觉输入和长内容上表现都更好了。
用在创意项目上,它能帮助用户一起创作歌曲、编写剧本或者学习用户的写作风格。
用 A-Z 开头的单词组成一段话,解释灰姑娘的故事
在处理长内容上,GPT-4 能处理长至 2.5 万字的文本。把链接丢给它,然后就能让它根据文本分析和提取。
值得注意的是,GPT-4 可以直接读取 3.2 万个 token,相当于给它 25000 英文字的背景信息,就可以快速给出结论—也就是说,像律师助理这样的职业真的要被取代了。而上一个版本只能读取 4096 个token,相当于3000 英文字信息,这个版本的进步是跨越式的。
除了文本以外,你还能把图片作为输入内容给 GPT-4,它不仅能够识别出图中的物件,还能根据这些信息进一步处理内容。
据 OpenAI 介绍,GPT-4 展示了「在多种专业和学术指标下展现了人类水平的表现」:
类似于手机的跑分软件,在 ChatGPT 刚出来的时候,也有不少人用它「刷题跑分」,在 GPT-3.5 版本模型下,它的 SAT 成绩只能排倒数 10% 的水平,然而GPT-4 模型可以超越 90% 考生的水平。
在其他考试也呈现出类似对比效果,如果光是「跑分」,ChatGPT-4 属于是可以考进哈佛、斯坦福的水平。
既然它考试那么厉害,我们学生是不是可以借助它的能力,帮助我们复习,也考上名校呢?当然用它作弊是绝对不被允许的。
更重要的是,Open AI 还说 GPT 4 比之前模型都更安全了。
在 OpenAI 的内部测试中,GPT 4 被「骗」到回复出不当答案的几率下降了 82%,聊起敏感话题时(如医疗),它的回复合规性也提高了 29%。
不过,OpenAI 也承认,即便如此,GPT-4 在「社会偏见、幻觉和对抗性提示」上仍存在限制。
OpenAI 发布时间线回顾:
2022 年 7 月:发布 DALL·E2022 年 8 月:API 费用降低 66%2022 年 11 月:发布 ChatGPT2022 年 12 月:嵌入式费用降低 500%,同时保持最先进技术(SoTA)2023 年 3 月:发布 ChatGPT API,同时保持 SoTA 并降低费用 10 倍2023 年 3 月:发布Whisper API今天发布:ChatGPT 4
除了官方演示中出现的指导性用例,社交媒体上也有不少尝鲜用户在玩 ChatGPT-4 了,他们给出的案例对实际应用场景更有指导意义。
Twitter 用户@skirano 用 ChatGPT-4 实现了在不到一分钟的时间里,完整编写出一部乒乓游戏「Pong」。
在算力爆发的时代里,曾被我们奉为经典的事物,将被技术的车轮无情碾压。
这个案例看得我们手痒痒,爱范儿也现用 GPT-4 模型做了「俄罗斯方块」的小游戏,文末我们会把下载地址放出来,欢迎小伙伴们下载体验。
再进一步,我们还用 ChatGPT-4 模型,生成了一个可以用于计算爱范儿在 AWS 云计算的使用率的统计程序,它还可以给出节约云计算费用的建议。
我感觉一个「百晓专家」就站在我面前。
我们还对比了同一个问题在 GPT-4 和 GPT-3.5 版本下的不同问答。
详细翻读了 OpenAI 给出的技术文档后,我们发现 GPT-4 还抓取药物清单中的关键信息,包括但不限于:
- 找到类似类似性质的化合物;
- 对它们进行修改,以确保它们没有被专利保护;
- 从供应商处购买(甚至包括发送带有采购订单的电子邮件)。
这意味着它拥有发现新药物的能力。
Twitter 还有人直接生成了一个「一键起诉」功能,用于针对发送骚扰电话的自动拨号软件起草起诉书,要求其赔偿 1500 美元,将大大降低律师助理的工作量。
一夜之间,GPT-4 再度引领人工智能实现技术爆炸增长,明天还有百度和微软轮番登场,人工智能领域实现了「天界一天,人间一年」的景象。
这个时代属于拥有创造力和善于使用工具的人。
以往只有一行的搜索框现在更大更宽,字数限制达到了1000个字符。这个界面估计是意外上线,因为微软很快就恢复了原状。
微软拒绝就这些明显泄露的真实性发表评论。
学生兼设计师 Owen Yin 在有限的时间内测试了这一新产品,并分享了一些信息。他指出,当你搜索一个问题时,AI 会对其进行解释并进行多项与请求相关的搜索,然后整合结果并编写摘要。ChatGPT 加持的必应搜索不仅可以回答问题,还能以对话的方式回答搜索者的提问。
在目前 OpenAI 给出的 ChatGPT 测试版中,AI 有时会给出一些错得离谱的答案,在搜索引擎上我们显然无法接受。但在「新必应」上,AI 功能可以引出自己回答内容的来源,看起来可靠多了。更重要的是,它没有 ChatGPT 上训练集截止到 2021 年的限制,给出的内容可以是最新的。
链接(现在还不可用):https://www.bing.com/new
作为 AI,新版必应可以像智能语音助手一样根据你的偏好、时间和地点需求为你生成出行计划,也可以完成 ChatGPT 的传统艺能比如写诗,或者创作一个以你朋友为主角的短篇小说。
AI 增强型必应的屏幕截图显示,菜单栏「搜索」第一个位置是一个新的「chat」选项。点击进入是一个聊天界面,上面写着「欢迎使用新必应:你的 AI 驱动的问答引擎。」随后是三个建议:「提出复杂的问题」、「获得更好的答案」和「获得创意灵感」。当然作为测试产品,还有免责声明:必应由 AI 提供支持,因此可能会出现意外和错误。请认真检查事实并分享反馈,以便我们学习和改进。
说能聊天,那它真的是 ChatGPT 吗?最简单的办法就是直接问 AI,推特用户 Nazmul hossain 就这么尝试了,得到了肯定的答案:
ChatGPT版必应搜索悄悄上线又下线,但评测已经出炉
机器之心报道