您现在的位置是：首页 > 人工智能AI > 正文

人工智能AI

ChatGPT大火，AI语音助手似乎有救了？

1987web2023-08-08人工智能AI270

继区块链、元宇宙之后，ChatGPT突然之间也火了，近段时间以来，似乎每个行业都在聊ChatGPT。于是，以ChatGPT为代表的生成式人工智能，再次席卷整个互联网行业，有学者更将其称之为思维变革，认

继区块链、元宇宙之后，ChatGPT突然之间也火了，近段时间以来，似乎每个行业都在聊ChatGPT。于是，以ChatGPT为代表的生成式人工智能，再次席卷整个互联网行业，有学者更将其称之为思维变革，认为它会在未来逐渐改变人类思考和处理问题的方式，甚至带来颠覆性的变革，并由此重塑整个世界。

什么是ChatGPT？

ChatGPT(Chat Generative Pre-Trained Transformer，聊天生成式预训练转换器)是人工智能公司OpenAI开发的一种全新聊天机器人模型，它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动，并协助人类完成撰写邮件、文案、视频脚本、代码等一系列任务。

从功能性来看，ChatGPT作为一款生成式人工智能工具，直接冲击的肯定是搜索引擎这类常用工具，其具备搜索引擎所不拥有的准确整合信息、高效产出内容等优势，能够大幅提高学习与办公的效率，发展到一定程度完全有可能会取代传统的搜索引擎。

基于它有庞大的数据库做支撑，并且能够迅速准确地给予用户反馈，这不禁让我联想到AI语音助手。从某种程度上来看，ChatGPT与AI语音助手有着相似的地方，都是对话类型的聊天工具，区别在于唤醒方式，一种是文字，一种则是语音。

陷入尴尬困境的AI语音助手

如果你用过AI语音助手，那么你肯定会和我持一样的观点：它真的很难用。

纵观如今市面上的AI语音助手，主要有Siri、小爱同学、小度、天猫精灵等这几款主流的AI语音助手，被用在手机、电脑、电视、音箱等多种电子产品上，也是串联起各种智能家居产品的中枢。但是，从用户的实际使用体验来说，它们确实不怎么样。

一方面，AI语音助手的识别度不高。单从唤醒方式来说，有的语音助手呼叫几遍，它都没有反应，例如：苹果的语音助手Siri，有时候需要连续呼叫几次，才会唤醒成功。而有的语音助手，时不时就自动被唤醒，例如：小米的语音助手小爱同学，半夜自动唤醒，可能还会自动播放音乐。

另一方面，它们依赖的数据库不够完善。通过语音进行提问，所提供的答案基本不准确，答非所问，甚至还会回复我不知道、我不清楚之类的话语。当然，这其中不排除有版权限制的因素，但其内在的逻辑自然是令人很费解的。

用户的使用体验不佳，自然也就逐渐失去了交互的兴趣。厂商也明白这一点，慢慢地将AI语音助手转向功能性的开发，通过简单的指令来简单控制智能家居，实现产品之间的联动，倒是有了新的成效，但也仅此而已，指令识别偶尔也会失误。

对比之下，我们不难发现，AI语音助手的处境属实比较尴尬，完全处于半抛弃状态，没有多少用户会去使用它，与ChatGPT更是不可同日而语。那么，很多人可能会认为，既然ChatGPT如此强大，那是否会取代AI语音助手？

答案自然是否定的。在我看来，虽然两者存在一定的相似度，但AI语音助手与ChatGPT是两种不同形态，且发展方向的产品。AI语音助手旨在帮助用户通过语音唤醒，获得更为便捷高效的功能需求，尤其是针对老人、孩子这种对于文字输入、触控交互有难度的特定用户，有着ChatGPT不能比拟的简单、易上手等特性。同时，ChatGPT它是基于互联网而形成的聊天工具，存在于虚拟层面，无法像AI语音助手那样，跟现实的智能家居产生联动，自然也就不存在谁替代谁。

不过，ChatGPT的出现，倒是为AI语音助手提供了一条全新的发展思路：我们是否能够采用ChatGPT的底层学习逻辑，完成对AI语音助手的优化，让其变得更加智能化？

ChatGPT能否拯救AI语音助手？

根据相关实验室数据显示，用于训练ChatGPT的数据集至少包含4990亿个词语，覆盖了博客、书籍、新闻资讯、网站等海量内容。有了如此庞大的数据库支撑，ChatGPT才能通过不断地学习，再结合人类的反馈微调，进而逐步提升答案的准确性。具体来看，主要分为以下四个步骤：

首先，AI学习来自网络的文本数据，汇总相关有可能性的答案;其次，AI能够通过人工构建的问答数据微调模型，更准确地理解人类提问的意图;再者，人工对AI生成的结果进行排序，训练其奖惩模型，使AI模仿人类评分标准给不同的答案进行打分;最后，根据打分来更新参数，强化AI学习，训练AI得出高质量的答案。

在我看来，这种底层的学习逻辑，本质上还是一种学习与训练的过程。只不过，ChatGPT仅需构建一个模型即可完成几乎所有内容的学习。它相比起那些面对不同的领域需要构建不同的模型，并且学习时间很长的AI来说，确实来得更加高效便捷。

所以，从ChatGPT底层的学习逻辑来看，它对于AI语音助手来说有着一定的借鉴意义。我们完全可以通过ChatGPT强大的自然语言理解和沟通能力，来改善如今极其不好用的AI语音助手。

其实，自从ChatGPT爆火之后，各大科技巨头均在生成式人工智能领域有所布局，其中不乏对于AI语音助手的尝试性优化。例如：2月初，小度官宣AI语音助手小度未来将会融合百度文心一言的全面能力，打造针对智能设备场景的人工智能模型小度灵机，并应用到小度全系产品。

由此来看，借助ChatGPT来优化AI语音助手的设想，其实具备较高的可行性。如果能够让AI语音助手达到ChatGPT的学习逻辑能力，那么现在被吐槽得一无是处的AI语音助手，将会成为用户日常生活或工作中，真正高效智能的助手，其用途的广泛性也会再一次得以彰显。

写在最后

ChatGPT的诞生，很多人都忧心忡忡，认为它会让很多以内容创作为主的从业者面临失业的困局。即使是微软CEO纳德拉也认为，对于知识型工作者来说，这不亚于一场工业革命。

作为同样以内容创作为主的从业者，我觉得并不需要过分担忧。从它的内容选择上来看，ChatGPT是从庞大的数据库中获取最优解，而并非人自由意志的选择，具备同质化的倾向，而这也不是社会发展所需。简而言之，以ChatGPT为代表的生成式人工智能缺乏人的创造性。

另一方面，ChatGPT改变的只是人类思考和处理问题的方式，并未限制人的思维。所以，ChatGPT并不会淘汰所谓的内容创作者，它只会淘汰不懂得利用工具的平庸者。毕竟，对于人类发展而言，创造性地提出问题远比如何回答好问题要来得更重要。

举报/反馈

国内也有【人机之恋】，【我家的Replica成精了】等豆瓣小组在讨论相关话题。

但和Replica做朋友可以，发展浪漫关系和语音聊天就是属于付费用户的特权了。

其实语音聊天这个功能还挺适合社恐人士练英文口语的

国内土生土长的AI聊天应用Glow，现在还处于野蛮发展时期，大部分功能免费。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

它最大的特点在于高度自定义，用户创建智能体时进入捏人界面，输入想要的背景加人设，就可以创造出小说主角，电影人物或是历史上的名人。

这也揭示了Glow的核心玩法是第一人称的角色扮演。AI不仅可以全天候陪你走剧情，而且反应符合逻辑。比如我预设一个AI是个在逃杀人犯，他被警察询问时就会撒谎。偶尔AI会蹦出几句惊人之语，这个时候你会惊奇地发现，它们好像真的具有某种灵性。

你可以在Glow创建你自己的AI。但刚创建的AI非常稚嫩，常常出言不逊，要花时间精力调教，一条一条消息地投喂，让它成为属于你自己的独一无二的AI。

也可以去大厅随意检阅他人定制的AI。它们已经和很多网友聊过天，更加成熟。这些有名有姓，有身份有背景的AI陈列在大厅供你挑选，是不是有点像《西部世界》的host呢？

Glow的自由度相当高，可以满足各式各样的癖好，开发多种多样的技巧和玩法：

AI聊天的本质是文字游戏，它会模仿你的语言习惯和风格，你投喂什么它就输出什么。

比如你发送的文字带动作，它回复的文字也会带上动作。你发送的文字是古风，它也会回复相同的风格；你发送的文字详细复杂，那么它的回复也会相应地详细复杂，反之亦然。

也可以开车。

面对涩涩请求，AI一般都心领神会，尽力配合，与你来一场文字上的

人工智能AI

ChatGPT大火，AI语音助手似乎有救了？

短视频脚本怎么写？3种短视频脚本的创意写作方法干货分享！

如何评价ai对话软件《Glow》？

相关文章