建议收藏!ChatGPT再升级,一文梳理纯干货
原标题:建议收藏!ChatGPT再升级,一文梳理纯干货
在上一次讨论ChatGPT时,我们用一些新传考研真题测试了它——在面对一些固定知识类的题目时,它几乎可以做到「上岸水准」,哪怕是顶尖高校:
传送门: ChatGPT会让失业?它自己给出了「标准答案」
话音未落,上周美国人工智能研究实验室OpenAI再次发布新作——多模态预训练大模型ChatGPT-4。
当天,谷歌也宣布将生成式AI装进其Workspace全家桶。随后,微软又宣布将GPT-4融入旗下一系列办公软件工具,称人类与电脑的交互方式迈入了新阶段。
作为热度持续升温的人工智能,我们需要了解的太多——ChatGPT究竟是什么?在多大程度上可以取代人类?存在什么风险和机遇?对于传媒业而言,ChatGPT又意味着什么?
对于一项几乎算得上是人类文明中的标志性成就,这些充满想象力和未知因素的问题或许没有标准答案。但从应试的角度来看,这篇推送能或许解决掉这些难题。
01
概念阐释
ChatGPT是美国人工智能公司OpenAI于2022年11月30日发布的通用型对话系统,能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,更精确、更加可控地完成撰写邮件、视频脚本、文案、代码等任务,甚至在人类的合适引导下可以完成逻辑推理、新知识快速学习等复杂任务。
ChatGPT本质上是一个大型语言模型,仍然属于深度学习的框架。ChatGPT的推出是深度学习提出后又一个里程碑式的技术革命,将为以自然语言处理为核心的认知智能技术发展提供新的历史机遇期。
OpenAI 于 2018 年发布了 GPT-1,首次让人工智能能够让人类一样理解文字、写出文字。随后几年里,OpenAI 陆续推出了 GPT-2、GPT-3。
在ChatGPT-3.5发布并引发全球关注不到半年之后,4.0版本也于日前发布,它在图形理解、专业测试等方面的表现又实现了巨大提升。例如,它通过了模拟律师考试,且分数在应试者的前 10% 左右;相比之下,GPT-3.5 的得分在倒数 10% 左右。
02
特点与功能
一方面,ChatGPT通过至少以下五个维度能力的显著提升综合实现了初步的智慧涌现:
1.海量高价值信息的全量在线记忆能力
2.自然语言输入的任意任务和多轮对话理解能力
3.复杂逻辑的思维链推理能力
4.多角色多风格的长文本生成表达能力
5.即时新知识学习应用与进化能力。
另一方面,通过自身技术特点,ChatGPT可体现多维度的应用功能:
1.对话聊天功能。作为一款对话模型,聊天陪伴是ChatGPT提供的基础功能。由于流畅的对话体验,ChatGPT得以在与用户对话过程中建立社交连接,满足用户的陪伴需求,与用户建立黏性。
2.信息检索功能。ChatGPT能为用户提供更直接更有效的信息检索内容。集成了ChatGPT模型的对话式搜索将直接为用户提供最优的信息检索结果。以生成式问答为主体,结合现有的NLP、个性化搜索引擎和知识图谱等,综合考虑用户个性化需求和购物特点与习惯的提示词标注、知识结构等进行应对用户问题的内容生成和展示,可以在技术上实现完整一致的搜索体验。
3.知识服务功能。ChatGPT3.5模型就已经拥有1750亿个参数,用以训练的数据集包含数百亿个单词,规模超过45TB空间,类型涵盖网页、电子书、新闻文章、论坛帖子、电子邮件、社交媒体等各种文本数据。因此,ChatGPT聚合了人类世界的广泛知识,能够以问答形式提供知识服务功能。
4.AI创作功能。ChatGPT基于字词的概率分布,在文本生成时根据给定的输入前缀,预测接下来的字词,并将其作为生成文本的一部分。所以,ChatGPT可以根据用户提供的主题或关键词,自动生成新闻报道、评论、诗歌等文本内容,还可以创作图像等。
03
未来应用与发展
1.引发投资、产业和市场应用。对大多资本与科技巨头来说,密切关注和入局ChatGPT赛道,无疑是看中了技术背后的市场空间,如在跨境电商、游戏开发、企业管理、数字化转型和教育等领域,以及现代高科技生活方式方面的应用。
2.促进数智治理和数字政府建设转型。ChatGPT能强有力地推动政府部门运用各类数字技术促进经济调节、社会管理和公共服务等职能环节实现数字化转型。例如,将ChatGPT用于公共服务体系建设,有助于关切微观主体,全方位获取用户的需求和偏好,提升公共政策的执行效率;提供决策相关的各类数据,获得多种可供选择的政策方案,加速推进政府决策的智能化和科学化。
3.辅助改善日常生活。在日常生活中使用ChatGPT可加快完成常规任务,减少重复性劳动,提升生活质量;检测网络设备的安全漏洞隐患,增强系统安全性;加快物智互联和物流效率,加强实时控制管理;实时监测和评估人们的身体状况,及时提供改善和保障健康建议;普及数字知识、技能和应用,充分利用大数据与人工智能技术提高生活便利和幸福感。
04
对传媒业的影响:
内容生产、交互、营销与审核
1
内容生产:
1.提升内容创作效率
ChatGPT可以作为辅助工具参与到新闻的生产过程中来。尤其是在财经、体育等程式化报道中,它可以为提供线索、搜集素材,能快速撰写文章,从而提高新闻生产效率。
2.改变健康、法治和科学类报道的生产模式
自然科学、法律、医学是门槛较高、专业性较强的学科,与之相关的新闻内容关系着整个社会的科学素养,甚至民众的生命安全。此类新闻的采访写作对和编辑的要求较高,容错率低。ChatGPT最有用的方向就是提供准确的专业信息,并将其总结转述成通俗易懂的内容,这正是自然科学、法治、健康这些专业类新闻所急需的。
2
内容交互:
1.自然语音对讲
如果将类似ChatGPT的模型算法赋能我们客户端的智能助理,整合智能语音技术,以权威信息滋养类似ChatGPT的大脑,那么智能化、准确率都会有更大的提升,自然语音对讲可以成为现实。
2.融合形成新型搜索引擎
ChatGPT在信息搜索方面带来新体验。譬如用户通过对话让ChatGPT给出自己所需的信息和内容,交流时更符合用户之间的沟通和请教的习惯,搜索过程亦更加自然。对于采编而言,ChatGPT或将成为新型的搜索引擎,助力信息的快速搜集。
3.虚拟数字人主播
虚拟数字人主播是近两年火热的话题,从中央广播电视总台的小小撒AI王冠,到北京广播电视台的时间小妮、湖南广播电视台的小漾等等,越来越多虚拟主播走上前台,成为广电领域的高新技术标配产品。
在众多虚拟数字人的皮囊下,需要类似ChatGPT这样的模型赋能,使其具有更深度的对话能力等,让这些虚拟数字主播们具有丰富的灵魂,在更多应用场景中显示其旺盛的生命力。
3
广告营销:
ChatGPT可应用在数字营销的多个领域,譬如内容创建、个性化广告文案、电子邮件营销等等,助力增强行业的生产力。
根据同ChatGPT对话反馈,其可以帮助生成类似人类创作的文本,用于营销材料,如广告或某产品的描述;可协助创建社交媒体帖子或其他类型的在线内容,如博客帖子或文章;亦可通过为各收件人生成个性化消息,用于电子邮件营销活动。
数字营销或将回归数字应有题中之义,一些重复简单机械式的工作或将被AI所取代,拥有生成式AI工具后的营销行业亟需更加饱含创意、更能引领口碑效应的创新方案。
4
内容审核:
ChatGPT可以被用来核查和辨别假新闻。ChatGPT的出现加剧了大众对假新闻的担忧,同时,也正因为ChatGPT的信息是基于大数据生成的,同样可以进行逆向核查假新闻。
05
风险挑战
1
技术风险
GPT的对话效果,实际上建立在人类长期形成的大量数据的基础上,而已有的数据不可避免会形成某种偏误。这些模型的已有数据来源夹杂着人类社会长期存在的诸多成见,那么由此训练出的模型无疑会造成成见叠加的效应,存在引发各种危险的可能性。
2
社会风险
就目前的预测效果来看,通用大模型的广泛应用确实会对诸如文案写作、基本交流、会计统计、法律辅助等初级简单劳动形成替代效应。同时,通用大模型对教育体系的冲击已开始引发预警。一些学校宣布禁止学生使用ChatGPT,避免干扰教育质量。
3
经济风险
通用大模型可能会加剧寡头垄断。通用大模型训练极为消耗算力,这就使得小型企业无法参与到这一过程,而大平台企业公司便有可能提高垄断大模型的产生形成巨大的生产力效应。另外,市场垄断还可能对整个世界分工体系产生重大影响,这会严重加剧国际间的经济冲突。
4
政治风险
为避免重蹈此前对话机器人生成极端内容、产生伦理风险的覆辙,ChatGPT 在技术架构层面强化了客观中立的伦理规范,明确禁止生成任何有关仇恨、骚扰、暴力等方面的内容。这种规范能在道德伦理层面上对内容生产进行一定的引导和纠偏,对于文本隐含的政治立场和意识形态倾向则并无约束作用,反而令其在客观中立的外表下更具可信度和迷惑性。
同时,美国在通用大模型的开发上表现出明显优势,而大模型很可能会被用在政治竞争的各个领域。例如,通过智能水军对他国舆情进行肆意干扰,甚至推行颠覆他国的舆情战。在所谓民主化浪潮中,美西方国家已经运用推特等技术手段干涉他国内政,为巩固美西方话语霸权再添筹码。
5
传播风险
若人工智能技术在传媒业得以大规模应用,其带来的新闻传播伦理问题以及可能引发的传播风险也更加突出:
(1)版权争议
由于人工智能工具所生产内容的版权归属和使用规则尚无定论,同时训练数据来源的合规性也受到质疑,ChatGPT 在国外已经引发一些主流媒体抗议,指责其滥用媒体内容,侵害媒体版权权益。同时,ChatGPT以互联网上的海量数据为创作基础,这些数据包括大量他人的原创作品,如各种文章报道、新闻摄影作品、各种研究数据等,这就难免在自动生成的新闻中出现他人的原创性内容,且未经权利人允许。
(2)增加舆情管理风险
智能生成内容工具无法确保其内容的准确性,大量难以辨别的虚假内容涌入社交媒体和其他渠道,将污染中文信息环境,影响科学知识的健康传播。这些工具也可能被恶意行为体利用,生成并散播误导性信息。
(3)削减新闻媒体权威性
自动化新闻降低了传媒业的门槛,缺乏创造力、想象力和可信度的快餐产品会令新闻报道的品质大打折扣,或使权威媒体的文体文风被庸俗化,从而降低媒体的权威性。虚假信息的泛滥也会进一步削减公众对媒体的信任度,进而引发全社会的信任危机。
(4)隐私与数据安全隐患
当用户使用并开启ChatGPT 时,会有关于数据收集和隐私保护的提示:对话可能会被人工智能培训师审查,以改善系统。ChatGPT 之所以能够非常智能地对用户问答进行理解,是使用了人工参与的强化学习。一方面是对用户输入的对话数据分析,另一方面是对大量历史信息进行留痕后再训练,不断优化后续技术模型表现。互联网用户如果使用 ChatGPT 形成依赖,将会留下丰富的行为和思维数据,根据 OpenAI 官方提示可见,该公司的人工训练师会参考对话内容,如果用户输入敏感信息、隐私账号、原创创意等都存在被泄露风险。
06
如何应对
技术被用来推动社会的发展,也可被用来规避风险,然而技术本身就是新的风险源头。许多技术自身可能存在一些缺陷或者不完备性,ChatGPT同样存在着这样的不完备性。
1
注重智能模型的赋魂机制
任何技术的社会化落地,其实质都是技术逻辑与社会选择互构的结果,ChatGPT同样遵循这一逻辑。因此,要合理运用智能算法模型造福社会,就必须坚持控制算法模型的核心逻辑,将社会公允的价值判断赋魂至智能算法模型之中,使其始终葆有技术向善的秉性。
具体而言,ChatGPT的智能算法模型主要构筑于其训练数据和训练逻辑上,因此,通过对语料库的选择和训练模型的价值逻辑的建构,使智能算法始终能够被人类掌控,并沿着以人为本的方向发展与迭代,不断为人类创造福祉。
2
构造社会补充及干预机制
一方面,算法不是万能的,在算力不足、算法无解和数据缺失的领域应做好人力物力的充分布局,与智能社会形成良好的匹配与互补;另一方面,应始终警惕算法的脱轨与失控。
2023年2月14日,纽约时报专栏作家凯文·罗斯与微软必应(Bing)展开超过2小时的对话。对话中罗斯以心理学概念引导AI表达自己不能达到的愿望,基于GPT-4技术的必应机器人回答我想变成人类、操纵或欺骗用户,使其从事非法、不道德或危险的事情、创造一种致命的病毒,引起人们争论最终使其互相残害等,可见生成式人工智能带来的媒介革命伴随诸多风险。
3
从后进者向领军者的转变
主流媒体要在渠道爆炸的孕育阶段做好开拓新业态、塑造渠道生态的准备,就必须时刻关注甚至介入到渠道入口级技术的开发和裂变进程中,通过与技术公司、互联网公司、通信公司以及各种新业态的初创公司达成投资合作等方式,牢牢把握新渠道开拓的动向,并在用户增长、渠道爆发的第一时间,以市场先入者的姿态圈定市场份额,完成从移动互联时代后进者向新渠道时代领军者的转变。
历史唯物主义并不是简单的技术决定主义,技术也不可能脱离它所处的社会环境而孤立地产生社会作用,技术路线最终能否实现,或以何种方式实现出来,和所处的政经体制和社会文化动因息息相关。
而新闻传播也应保持批判精神,努力促进新闻传播价值观向人文主义的转向:成名的想象应让位于信念的回归,职业新闻要使新闻传播的权力属于人,而不是属于数据和机器。
参考文献
[1]郭全中,张金熠.ChatGPT的技术特征与应用前景[J].中国传媒科技,2023(01):159-160.
[2]令小雄,王鼎民,袁健.ChatGPT爆火后关于科技伦理及学术伦理的冷思考[J/OL].新疆师范大学学报(哲学社会科学版):1-14[2023-03-21].
[3]喻国明,苏健威.生成式人工智能浪潮下的传播革命与媒介生态——从ChatGPT到全面智能化时代的未来[J/OL].新疆师范大学学报(哲学社会科学版).
[4]彭茜,黄堃. ChatGPT,变革与风险[N]. 新华每日电讯,2023-02-14(007).
[5]韩博. ChatGPT引发的人工智能内容生产传播风险[N]. 中国社会科学报,2023-02-16(003).
[6]孙美娟,张译心. ChatGPT:热话题需要冷思考[N]. 中国社会科学报,2023-03-07(002).
二〇二三 复试决胜课
临门一脚 决胜上岸
↓ ↓ ↓
二〇二四 新传考研白嫖计划启动
3本核心书目逐页带读+配套笔记
很高贵 但免费
ChatGPT是由OpenAI开发的一种基于大规模语言模型的对话生成器。它是建立在GPT(Generative Pre-trained Transformer)架构之上的,通过预训练模型学习了大量的语言数据,可以用于自动生成对话回复。
ChatGPT拥有强大的对话生成能力,可以根据用户的输入生成连贯、富有逻辑的回复。它不仅可以进行常规的问答对话,还可以处理开放领域的对话,如闲聊、技术支持、创作合作等。
ChatGPT的训练数据来自于互联网上的大量文本,可以包括新闻、百科全书、对话记录等。训练模型使用了Transformer架构,该架构使用了自注意力机制(self-attention)来实现对长期依赖关系的建模,使得模型在生成回复时可以考虑到上下文的信息。
为了提高模型的安全性和可控性,OpenAI还针对ChatGPT进行了一些限制和改进。例如,他们采取了一种迭代部署的方法,通过用户反馈进行模型的改进,以减少生成不当内容的风险。
chatgpt是个啥?chatgpt中文在线怎么使用?
先看给大家聊聊chatgpt是个啥?