为保护用户隐私,这家法国创企打造的离线AI语音助手要用“放弃云端”换取数据安全
原标题:为保护用户隐私,这家法国创企打造的离线AI语音助手要用放弃云端换取数据安全
【猎云网(微信号:)】6月7日报道 (编译:AlphaMk)
编者注:本文原作者为Jared Newman。
在不向云端上传语音命令的情况下,用户能对类似亚马逊Alexa这般的语音助手交代任务吗?Snips公司决意找出答案。
这家总部位于法国巴黎的AI初创公司的首席执行官兼公司合作伙伴Rand Hindi先生相信:语音助手正在误导我们。
Hindi表示:亚马逊的Alexa和谷歌语音助理让消费者们认为每一个语音命令都必须被处理且进行在线存储,即使任务本身和互联网没有什么内在联系。通过Snips,他希望证明这一点是错误的。在过去的几年里,Snips一直在为不希望依赖于Big Tech的个人开发者和企业建立离线语音助理。该创业公司目前正在开发自己的消费硬件,硬件包括一套智能扬声器和一个处理语音命令的本地基站。
Hindi说:我们在人们的交易意愿上下了一个很大的赌注——以隐私保护为重点。我们希望隐私将成为我们产品的主要亮点。当然,这在以前世没有人做到过的,因为以前没有人能做到这一点。
Hindi承认:在与科技巨头的竞争中,Snips面临着许多风险与挑战——未知的新玩家随时都会异军突起进入这场博弈中。但他也对自己这家创业公司的技术充满信心。随着人们开始考虑科技巨头所具有的巨大力量——部分来源于他们收集到的大量消费者行为数据——而Snips的离线语音助手可以恰好在此时入局。
无需云端支持的语音
Hindi表示:几乎所有其他的语音助手都是围绕着由巨大的数据中心提供的无限云存储和计算能力而构建的。为了创建一个离线工作的人工智能,Snips削减了很多被认为没有存在必要的特性和性能。
例如,语音识别,Hindi相信AI依赖的数据量会减少,所以Snips存储更少。
我们注意到,实际上,随着数据量的增加,性能的对数增加,这意味着在某一特定点之后,从其他用户那里添加更多的数据实际上不会带来更多的价值。他说。这就是80-20法则。你用20%的数据得到80%的精确度。
为了让自然语言能得到理解,Snips设计了一种方法来训练自己的AI,而且在不记录用户语音内容的前提下。当开发者想要增加新技能时,Snips可以通过像亚马逊的Mechanical Turk这样的服务来雇佣人们以产生数以千计的口头命令样本来训练人工智能。Hindi说,这种方法可以在不收集任何用户数据的情况下获得90%的准确度。
编者注:亚马逊劳务众包平台(AMT)源于2005年,搭建的初衷仅仅是为了解决内需——管理库存,将图片和产品分类,翻译文本,将语音或者图片转录成文本,检查拼写错误,验证地理位置,对产品进行评论等等。时至今日,AMT注册用户量累计过50万,并将这种众包式的数据标定工作发展成为一个崭新的行业。这些注册用户将自己称作Turker,他们就像AI版的富士康流水线工人。
坦率地说,我们最后得出的结论是其实在训练数据中交易隐私实际上没有什么价值,因为你可以在不从用户那里得到真实的数据的前提下就得到同等的训练数据。他说。
Snips甚至重新改写了谷歌用于机器学习模型的流行开源机器学习框架TensorFlow的元素,以使其更加轻量。
在过去的整个语音的堆栈中,我们基本上必须要找到一种方法来真正精炼每一个性能以达到如今我们能在Raspberry Pi上运营一个类似Alexa的语音助手的水平。
编者注:The Raspberry Pi Foundation是英国一个小型的慈善组织,成立的宗旨在于推广科技,而非以销售技术来营利。该基金会过去从来没真的发表过一款产品,因而选择了两家全球渠道商e络盟和RS Components为其处理首批Raspberry Pi订单。Raspberry Pi是一款针对电脑业余爱好者、教师、小学生以及小型企业等用户的迷你电脑,预装Linux系统,体积仅信用卡大小,搭载ARM架构处理器,运算性能和智能手机相仿。
这有点夸张。虽然Snips可以在Raspberry Pi等迷你计算机上进行运行,但与Alexa或谷歌助手相配的通用AI需要更多的计算能力来支持。在没有通过云端发送命令的情况下,控制其他如咖啡机或电视机设备会变得更加棘手。
为此,Snips将其平台设计成模块化。开发人员可以将诸如唤醒字处理或自然语言识别等个人元素卸载到另一个设备上,或者他们可以使用更强大的计算机来处理更广泛的语音命令。但这个想法基于要有一个能随着时间的推移变得更有效和连接性的系统,而不必依赖于云端。Hindi说:目前我们正在建造的是在用户家中的可以互相操作的设备网络。
Snips可以通过使用云计算和删除客户数据而不是集中数据来避免所有这些并发症,相似的另外一家初创企业Mycroft目前也在这么做。但Hindi表示:对于那些想要这项技术许可的公司来说,这种方法显示了持续性的成本投入;同时,它也更容易受到黑客攻击或政府介入。
他说:任何声称在云端处理声音的同时提供隐私的人,坦率地说,充其量大多是无用的,最坏的情况可能就是本身就是一个谎言。
硬件和区块链技术
所有这些都为消费硬件奠定了基础。今年5月,Snips公司宣布了一款名为Snips Air的概念产品,它由一个智能扬声器基站和用户可以在家中安装的卫星麦克风组成。Hindi说AI技术已经到位,Snips截至目前已经拥有超过12500名注册开发者,他们在平台上建立了超过20000种技能。现在,启动只需要建立运行他们的硬件就可以了。
至此,事情变得与时俱进一些了:尽管Snips公司在风险投资方面已经筹集了2200万美元,目前公司仍然通过虚拟代币发行来为硬件筹集资金。创业公司将会进行一场ICO,投资者可以通过如比特币和以太币这样的现有虚拟代币来购买通证;而第三方开发者通过区块链进行交易出售第三方语音技能来交换通证。
Hindi认为这种方法不仅迎合了利用虚拟代币进行资本筹集的狂热,同业也适用于Snips就隐私保护的观点。通过用去中心化的货币处理技能购买,Snips避免了用户必须要有信用卡以及了解客户群体的问题。
老实说,我们曾经试图找到另一种方式,但我们当时马上就面临了信用卡和身份认证的问题,而这在当时只是一个非常非常简单的解决方案。他说。我知道目前区块链仍然不是一个非常成熟的技术,它仍然有很多风险,而且仍然有很多的知识普及要去做,但是它确实解决了我们的隐私问题。
也就是说,你仍然可以用信用卡购买硬件本身——假设它变成了一个实际产品。 Snips Air硬件仍处于概念阶段——它的效果图该公司正在制作中,而且这家公司此前还没有创造消费设备的经验。同时也不能保证,ICO能投资集得Hindi声称用于实现产品的3000万美元。
不过,Hindi表示Snips不仅仅是试图将技术推向更大的公司,当下更多的重点集中在私人语音助理的愿景上。就这一点而言,他还没注意到科技巨头在这方面的竞争。
他说:我认为这很困难,因为那些真正对语音有意向的公司仍然滞留在20世纪90年代商业模式的数据中。如今,就设计出能替代当下存在的隐私保护产品而言,我们有更大的机会。
为了解决这一方面的难题,深圳唯创知音在市面上推出了一款,低成本无需联网的离线语音识别方案,WTK6900H,可通过语音进行操控使用,仅需一句话便可唤醒工作,5米远程识别,识别率高达95%以上,即使在风噪的环境下,WTK6900H也拥有AI自适应降噪识别算法,可过滤掉稳态噪声、对动态噪声也有很好的抑制作用,噪音下也可准确识别。
视频展示
智能风扇语音控制芯片,无需联网,纯离线AI语音芯片WTK6900H
智能语音控制风扇,是一款能通过声控的方式,来控制风扇的风速、摇头、定时的智能家居产品,从刚面世至今,拥有了语音控制的风扇,被许多消费者青睐。
三招轻松搞定展示类短视频脚本
一笋最近粉丝有人问我:我想要拍一个头图展示商品的视频,应该拍什么呢?我拍摄的宝贝内容太单一,且也不吸引人,展示类的短视频脚本该怎么写呢?