谷歌推出AI语音助手领域王牌,语音助手体验惊人!
原标题:谷歌推出AI语音助手领域王牌,语音助手体验惊人!
2018年,Google I/O大会上,谷歌CEO劈柴祭出了这次大会的王牌——AI语音助手(Google Assistant)。
相比Apple Siri的机械式的对话语音互动,Google Assistant提升了持续性对话和多重行动两大功能,使语音互动变得自然、亲和,不会让接听者听出来电话的一边不是真人,而是AI的真人式语音应答。
以下是Google I/O大会上,Google Assistant与商户的通话内容节选:
Google Assistant:你觉得时间定为3号可以吗?
理发店:我需要查查Jim老师的档期,稍等。
Google Assistant:嗯哼?
这一句嗯哼惊艳全场,AI的反应出乎了现场所有人的预料。诚然,对于人类来说,诸如嗯、呃之类的语气词是再正常不过的,但是对于机器而言,这是一件难以做到的事情。
厉不厉害?惊不惊艳?整个打电话预约过程中,让人几乎感觉不到这是AI与人的对话,而是人与人的对话。这段演示吊足了人们的胃口,让人不禁更加期待Google Assitant带来的更多可能性。当然,餐厅和发廊等服务公司也可以用这个功能接听电话,从而节省大量人力物力。目前,Doordash、711、星巴克等餐饮品牌都与Google Assitant进行了合作。这里要说明的是,这个功能是通过谷歌开发许久的AI系统Google Duplex实现的,目前尚处于内测阶段。其实,谷歌助手打call的这一新能力,并不是新鲜事。尤其实在人工智能应用领域,国内的商业化速度甚至超过国外,且市场潜力巨大。目前企云时代推出的小云智能电销机器人,在面对金融贷款、装修、家居、汽车、房产等行业某一领域内所展现的智能程度就丝毫不输于谷歌电话助手。
两者不同之处在于,谷歌语音助手拥有更为庞大的社会型知识图谱,基本上任何问题都能通过知识库的搜索匹配给予恰当的回答,属于全能型。
而小云则是专注于某一特定业务领域,通过相关业务知识库、问题库的建设积累来进行相应对话,属于专业技能型。
那么小云在应用领域,具体都有哪些优势呢?
01降低企业营销运营成本
人工在工作的过程中,难免会遇到各种情况和客观因素,比如情绪波动、吃饭、喝水,每一件事情都要花费很多时间。同时,企业还要付给员工薪资,不仅仅是五险一金,节假日福利也必不可少。更多的是,每家企业每新招一位销售或客服,都需要对员工进行专业的培训。再加上较高的人才流动率,每年耗费在招聘、培训上面的成本居高不下。小云智能电销机器人,每一项具体的业务,只需训练一次。并且小云智能电销机器人可以提供全国固话线路,因此可以在外呼方面帮助企业降低通讯成本。
02大大提升客户筛选效率
人工记录充满主观性,分类不明确、跟进不及时都会导致客户流失,而小组成员撞单、资源重复,造成客户无法返回,导致工作质量下降,事倍功半。小云一天最少可拨打1200通电话,并且还有比较人性化的功能:根据客户的意向程度后台自动分类出ABCDE类客户,支持列表批量导出。只需销售经理对接意向客户转化成企业客户,大大提高工作效率。
03能识别方言
不仅支持普通话识别,而且还能听懂和识别四川话。是目前市场上唯一可以提供四川话识别引擎的。毋庸置疑,在基础研究领域以及综合能力等方面,谷歌的实力很强。但是在细分领域的应用,紧贴着用户真实场景的小云,完全可以超越谷歌语音助手。当你还在为这些充满未来感的高科技叹为观止之时,已经有人在奋力抓准时机,使用小云了。
AI时代已经到来
时不我待
-
上一篇
背景
语音转字幕是如今自媒体创作的刚需,但是,目前市面上可用的要么需要付费;要么需要下载各式各样的软件,很麻烦而且有时候安装环境需要调试;要么需要上传文件,存在隐私问题,所以本期视频就来提供一套免费的终极AI自动字幕生成方案,解决上述所有问题。
大家好,我是专注于收藏知识的弓良同学,希望这些知识在进入收藏夹吃灰前,能给你带来小小的收获。
方案
这套方案包括内嵌字幕和外挂字幕两种方案,外挂字幕方案仅需浏览器无需下载任何软件,并且可以本地运行,解决隐私问题。
方案一:内嵌字幕方案
主要使用必剪,剪映等剪辑平台配备的自动ai字幕生成工具。以下面这个音频为例子:「大家好,我是专注于收藏知识的弓良同学,希望这些知识在进入收藏夹吃灰前,能给你带来小小的收获」。
首先,打开必剪,然后上方点击开始创作。在本地素材的栏目下,在左上方点击导入素材,选择你包含语音的素材进行导入。目前,该素材已经被导入。然后,拖动该素材到下方的时间线窗口。接着,点击左上方文本栏目,在这个栏目上方有一个识别字幕的栏目。点击选择该栏目,然后点击开始识别,稍作等待。这样,需要的内嵌字幕就已经自动识别完成。之后,在下方的时间线窗口,点击字幕,在右上方可以看到全部字幕内容。你只需要对其中一些错误进行修改即可。
剪映也是类似的操作。首先,打开剪映,然后在上方点击开始创作。然后在左上方点击导入,选择你包含语音的素材进行导入。接着,将该素材拖入时间线。然后,点击左上方的文本栏目,然后再点击左方的智能字幕,然后点击左上方的开始识别,稍作等待。这样就完成了,同样在右上方可以看到全部字幕内容。后续稍作修改即可。
方案二:外挂字幕方案
这个方案是我个人独立开发部署,承诺永久免费,求三连支持,正常普通话识别正确率百分之95以上。对电脑无配置要求,以五年前的电脑配置为例,1分钟的文字内容需要1到1.5分钟进行生成。
首先打开chrome浏览器或者microsoft edge浏览器,输入网址,https://godlucky.net/whisperapp/,网址链接请在置顶评论直接复制,不需要什么关注分享等额外操作。
接着在上方选择模型这个栏目,模型包含模型的语言和大小,模型越大,生成更精准,但是速度会慢一点,在此,我们先点击小,中文1按钮。接着,模型会自动下载,仅需下载一次,会缓存在本地,稍作等待。右边显示loaded即完成。
下一步,点击下面选择媒体文件栏目下的"choose file",选择你包含语音的素材进行导入,在页面下方转写进展文本框,显示媒体文件已载入即成功。下一步,在下方选择素材的语言,默认中文。
最后一步,在下方选择开始转写按钮,文字内容就会在下面转写结果文本框中实时生成,一直到下方转写进展文本框显示已完成,请查看转写结果即完成。
可以在下方的转写结果文本框里直接修改复制转写结果,或者点击最下方的下载转化结果文件按钮,会以lrc格式下载。如果需要srt格式,点击下载转化结果文件右边的歌词字幕转化工具进行格式转化,有时候转化的文字可能会是繁体字,点击右边的文件简繁转化进行格式转化,后续生成其他内容,清空转写结果,导入新的素材,重新点击转写即可。
如果出现问题刷新页面重新生成即可。后续只要网页保持,无需上网也可以正常使用该工具,实现离线使用,也真正实现隐私保护。欢迎在评论区回复使用反馈,后续还会进行迭代更新。
结语
终极AI语音字幕生成方案-免费,免安装,本地运行1.0
-
下一篇
海外电话不敢接?AI语音助手,社恐福音!
相信海外留学生都有过同样的