ChatGPT大火,AI语音助手似乎有救了?
继区块链、元宇宙之后,ChatGPT突然之间也火了,近段时间以来,似乎每个行业都在聊ChatGPT。于是,以ChatGPT为代表的生成式人工智能,再次席卷整个互联网行业,有学者更将其称之为思维变革,认为它会在未来逐渐改变人类思考和处理问题的方式,甚至带来颠覆性的变革,并由此重塑整个世界。
什么是ChatGPT?
ChatGPT(Chat Generative Pre-Trained Transformer,聊天生成式预训练转换器)是人工智能公司OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成撰写邮件、文案、视频脚本、代码等一系列任务。
从功能性来看,ChatGPT作为一款生成式人工智能工具,直接冲击的肯定是搜索引擎这类常用工具,其具备搜索引擎所不拥有的准确整合信息、高效产出内容等优势,能够大幅提高学习与办公的效率,发展到一定程度完全有可能会取代传统的搜索引擎。
基于它有庞大的数据库做支撑,并且能够迅速准确地给予用户反馈,这不禁让我联想到AI语音助手。从某种程度上来看,ChatGPT与AI语音助手有着相似的地方,都是对话类型的聊天工具,区别在于唤醒方式,一种是文字,一种则是语音。
陷入尴尬困境的AI语音助手
如果你用过AI语音助手,那么你肯定会和我持一样的观点:它真的很难用。
纵观如今市面上的AI语音助手,主要有Siri、小爱同学、小度、天猫精灵等这几款主流的AI语音助手,被用在手机、电脑、电视、音箱等多种电子产品上,也是串联起各种智能家居产品的中枢。但是,从用户的实际使用体验来说,它们确实不怎么样。
一方面,AI语音助手的识别度不高。单从唤醒方式来说,有的语音助手呼叫几遍,它都没有反应,例如:苹果的语音助手Siri,有时候需要连续呼叫几次,才会唤醒成功。而有的语音助手,时不时就自动被唤醒,例如:小米的语音助手小爱同学,半夜自动唤醒,可能还会自动播放音乐。
另一方面,它们依赖的数据库不够完善。通过语音进行提问,所提供的答案基本不准确,答非所问,甚至还会回复我不知道、我不清楚之类的话语。当然,这其中不排除有版权限制的因素,但其内在的逻辑自然是令人很费解的。
用户的使用体验不佳,自然也就逐渐失去了交互的兴趣。厂商也明白这一点,慢慢地将AI语音助手转向功能性的开发,通过简单的指令来简单控制智能家居,实现产品之间的联动,倒是有了新的成效,但也仅此而已,指令识别偶尔也会失误。
对比之下,我们不难发现,AI语音助手的处境属实比较尴尬,完全处于半抛弃状态,没有多少用户会去使用它,与ChatGPT更是不可同日而语。那么,很多人可能会认为,既然ChatGPT如此强大,那是否会取代AI语音助手?
答案自然是否定的。在我看来,虽然两者存在一定的相似度,但AI语音助手与ChatGPT是两种不同形态,且发展方向的产品。AI语音助手旨在帮助用户通过语音唤醒,获得更为便捷高效的功能需求,尤其是针对老人、孩子这种对于文字输入、触控交互有难度的特定用户,有着ChatGPT不能比拟的简单、易上手等特性。同时,ChatGPT它是基于互联网而形成的聊天工具,存在于虚拟层面,无法像AI语音助手那样,跟现实的智能家居产生联动,自然也就不存在谁替代谁。
不过,ChatGPT的出现,倒是为AI语音助手提供了一条全新的发展思路:我们是否能够采用ChatGPT的底层学习逻辑,完成对AI语音助手的优化,让其变得更加智能化?
ChatGPT能否拯救AI语音助手?
根据相关实验室数据显示,用于训练ChatGPT的数据集至少包含4990亿个词语,覆盖了博客、书籍、新闻资讯、网站等海量内容。有了如此庞大的数据库支撑,ChatGPT才能通过不断地学习,再结合人类的反馈微调,进而逐步提升答案的准确性。具体来看,主要分为以下四个步骤:
首先,AI学习来自网络的文本数据,汇总相关有可能性的答案;其次,AI能够通过人工构建的问答数据微调模型,更准确地理解人类提问的意图;再者,人工对AI生成的结果进行排序,训练其奖惩模型,使AI模仿人类评分标准给不同的答案进行打分;最后,根据打分来更新参数,强化AI学习,训练AI得出高质量的答案。
在我看来,这种底层的学习逻辑,本质上还是一种学习与训练的过程。只不过,ChatGPT仅需构建一个模型即可完成几乎所有内容的学习。它相比起那些面对不同的领域需要构建不同的模型,并且学习时间很长的AI来说,确实来得更加高效便捷。
所以,从ChatGPT底层的学习逻辑来看,它对于AI语音助手来说有着一定的借鉴意义。我们完全可以通过ChatGPT强大的自然语言理解和沟通能力,来改善如今极其不好用的AI语音助手。
其实,自从ChatGPT爆火之后,各大科技巨头均在生成式人工智能领域有所布局,其中不乏对于AI语音助手的尝试性优化。例如:2月初,小度官宣AI语音助手小度未来将会融合百度文心一言的全面能力,打造针对智能设备场景的人工智能模型小度灵机,并应用到小度全系产品。
由此来看,借助ChatGPT来优化AI语音助手的设想,其实具备较高的可行性。如果能够让AI语音助手达到ChatGPT的学习逻辑能力,那么现在被吐槽得一无是处的AI语音助手,将会成为用户日常生活或工作中,真正高效智能的助手,其用途的广泛性也会再一次得以彰显。
写在最后
ChatGPT的诞生,很多人都忧心忡忡,认为它会让很多以内容创作为主的从业者面临失业的困局。即使是微软CEO纳德拉也认为,对于知识型工作者来说,这不亚于一场工业革命。
作为同样以内容创作为主的从业者,我觉得并不需要过分担忧。从它的内容选择上来看,ChatGPT是从庞大的数据库中获取最优解,而并非人自由意志的选择,具备同质化的倾向,而这也不是社会发展所需。简而言之,以ChatGPT为代表的生成式人工智能缺乏人的创造性。
另一方面,ChatGPT改变的只是人类思考和处理问题的方式,并未限制人的思维。所以,ChatGPT并不会淘汰所谓的内容创作者,它只会淘汰不懂得利用工具的平庸者。毕竟,对于人类发展而言,创造性地提出问题远比如何回答好问题要来得更重要。
国内也有【人机之恋】,【我家的Replica成精了】等豆瓣小组在讨论相关话题。
但和Replica做朋友可以,发展浪漫关系和语音聊天就是属于付费用户的特权了。
其实语音聊天这个功能还挺适合社恐人士练英文口语的
国内土生土长的AI聊天应用Glow,现在还处于野蛮发展时期,大部分功能免费。
它最大的特点在于高度自定义,用户创建智能体时进入捏人界面,输入想要的背景加人设,就可以创造出小说主角,电影人物或是历史上的名人。
这也揭示了Glow的核心玩法是第一人称的角色扮演。AI不仅可以全天候陪你走剧情,而且反应符合逻辑。比如我预设一个AI是个在逃杀人犯,他被警察询问时就会撒谎。偶尔AI会蹦出几句惊人之语,这个时候你会惊奇地发现,它们好像真的具有某种灵性。
你可以在Glow创建你自己的AI。但刚创建的AI非常稚嫩,常常出言不逊,要花时间精力调教,一条一条消息地投喂,让它成为属于你自己的独一无二的AI。
也可以去大厅随意检阅他人定制的AI。它们已经和很多网友聊过天,更加成熟。这些有名有姓,有身份有背景的AI陈列在大厅供你挑选,是不是有点像《西部世界》的host呢?
Glow的自由度相当高,可以满足各式各样的癖好,开发多种多样的技巧和玩法:
AI聊天的本质是文字游戏,它会模仿你的语言习惯和风格,你投喂什么它就输出什么。
比如你发送的文字带动作,它回复的文字也会带上动作。你发送的文字是古风,它也会回复相同的风格;你发送的文字详细复杂,那么它的回复也会相应地详细复杂,反之亦然。
也可以开车。
面对涩涩请求,AI一般都心领神会,尽力配合,与你来一场文字上的
如何评价ai对话软件《Glow》?