让语音引爆数据

来源 :计算机世界 | 被引量 : 0次 | 上传用户:wenlingqiang6268047
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  美剧迷一定不会忘记《生活大爆炸》里来自印度的Raj购入iPhone 4S后,与Siri“谈情说爱”的情节。自从苹果在iPhone 4S上推出Siri以来,越来越多的人同智能手机对话,命令它们发送电子邮件、短信,查询路线以及在网上搜索信息。正是语音识别技术让这一切成为可能。
  语音识别技术是让机器通过识别和理解把语音信号转变为相应的文本或命令,也就是将人类语音中的词汇内容转换为计算机可读的输入,比如按键、二进制编码或者字符序列等。
  比尔·盖茨早在2007年时就公开表示,用不了多久,电脑键盘等外部输入设置,将完全让位给语音识别软件。
  虽然盖茨的预言尚未成真,但无论是国际大牌企业微软、苹果、谷歌,还是本土专注语音识别技术的科大讯飞、车音网,都积极布局市场,并不断有新势力加入。那么,在这场充满未来感的大战中,语音识别技术面临着怎样的瓶颈?这类由语音驱动的业务又瞄准了什么商机呢?
  巨头环伺
  众所周知,Siri使用的语音识别技术来自于美国的语音技术公司Nuance。据资料显示,这家从上世纪90年代就从事语音识别技术研发的公司已经拥有了近4000项专利及知识产权,能够识别约60种语言及方言,奥迪、宝马、福特、通用等诸多汽车厂商都采用了Nuance的语音识别、合成、自然语言理解解决方案。
  移动互联网时代,语音识别在人机交互方面有着独特应用价值,越来越多的IT巨头已经把触角伸向了语音识别领域。谷歌先后推出Voice Search和语音助手Google Now;微软推出了Microsoft speech SDK的开发包,让新开发的产品能嵌入语音识别和合成功能;英特尔的“感知计算”蓝图中将语音计算放在了显要的位置;移动智能设备领域炙手可热的三星也早在Galaxy系列设备中推出了个人语音控制系统S-Voice。在国内的语音市场,既有百度、搜狗这样的重量级玩家,也有传统巨头科大讯飞,同时还涌现出了一批诸如云知声、虫洞、智能360这样的后来者。
  其实40多年前专家们就曾宣称,语音识别将在5~10年内发展为一项成熟的技术。可多年过后,为什么他们依然重复着一模一样的说辞?其实,提供一个语音交互界面远比理解一打单词来得复杂。
  语音识别软件就如同一个人的耳朵和嘴巴,但缺少了大脑理解,这条沟通渠道仍然会受阻。除了语音技术本身外,人机语音交流中还有其他因素在作怪:输出方式、互动形式还有语境。服务器收到文字串以后,要如何分辨用户真正的意图?它是要查天气、看电视,还是购物?这需要语义理解,但不同的领域,语义理解差距太大,而且涉及的词汇和数据库也不同;接下来是知识图谱,如何将所有的知识通过类似于数据库和图的方式联系?虽然目前匹配的算法已经相对成熟,但其准确性仍然依赖数据源的丰富程度,同时要在不断产生的“交互数据”中动态调整匹配结果;至于排除环境噪音、音色等因素,还要依赖半导体传感技术的进步。
  如同“数学是科学的皇冠”一样,语音行业技术也有一个“皇冠”,那就是“语音识别”。为什么语音识别是“皇冠”?两点理由:一是技术上最难,二是实用前景最大。所以要考察一家语音公司的技术水平如何,就看它是否能提供高性能的语音识别产品。
  除了Siri, Nuance的另一款智能机应用Dragon提供的语言支持中也包括中国普通话。虽然中文版Dragon和其它多数语音识别软件一样不能达到百分之百准确,但从基本层面来说,还是非常不错的。首先,对于语音识别来说,中文极具挑战性,因为普通话有400个单音节声音,根据声调予以区别。尽管普通话是被官方极力推广的,但是中国还拥有很多种方言和数不尽的地方口音, Dragon研发副总裁Jim·Wu就曾表示:“在中国,每个人都有不同的口音,其中的一项挑战就是确保系统能够用于口音较轻的普通话用户。”
  在中文语音识别市场,科大讯飞一家就占据了中文语音市场约80%的市场份额。科大讯飞一直说自己的行业门槛高,主要就是指语音识别技术的门槛高。
  意在数据
  今天,几乎所有手机厂商和消费电子公司都试图将语音识别技术嵌入在其移动产品、应用和服务中。然而,语音软件不具备用户粘性,无法直接提供服务和内容。“试想,用户将语音转化成文本之后,下一步要做什么,和讯飞语音识别应用有关系吗?目前它只能作为一个插件、工具服务于后端的内容,例如社交、购物、搜索引擎、智能问答等。”独立财经分析师范小明以科大讯飞举例说道。
  2001年就推出了中文语音合成技术的北京捷通华声语音技术有限公司董事长张连毅表示:“从公司2000年成立以来,累计在语音技术上的投入至少超过两亿元。前七八年股东没从有限的利润中拿过一分钱,全部投入再开发。但由于市场有限,企业效益并不能立竿见影。”然而,张连毅口中“没钱肯定不行,但有钱也不一定就行”的语音识别技术为何还能吸引众多厂商?
  他们的目的不单单是为了让手机用户“解放双手”,抑或是让已成颓势的PC借此焕发青春,他们其实是瞄准了搜索的未来——语音搜索和通过其得到的海量数据。
  当你向个人语音助理如Siri发号施令时,苹果的服务器就能最先得到这个数据,也就是用户的语音样本。而正是通过采集这些语音样本,各公司才能进一步优化他们的语音识别技术。不仅如此,你通过Siri搜索,苹果会创建一个关于搜索条目的新型数据库,这与Google利用用户在搜索栏的搜索条目建立数据库其实是一个道理。而实际上,苹果的系统比这还要强大,它可以智能识别用户是否在搜索一些硬数据,即一些易于收集的可量化的事实,这也是最需要收集的理想数据,包括产出、质量、成本和时间四大类。这类请求苹果会传送给Siri背后的智能搜索引擎Wolfram Alpha,一个能根据问题直接给出答案的网站。
  虽然技术的进步总是让人惊叹,但语音识别是否真的能够取代触控技术?目前业界对此的看法也还很不一致。一方面是其技术难度较大;另一方面,虽然在游戏等领域的应用可能会让人比较期待,但是在一些涉密问题上是否也能应用语音呢?反正我不会对着电脑说出账号和密码登录网银。
其他文献
党的十八大将信息化作为全面建成小康社会的目标之一,并提出了走中国特色新型工业化、信息化、城镇化、农业现代化道路,促进工业化、信息化、城镇化、农业现代化同步发展。浙江省作为经济社会发展水平较高的区域,理应在信息化发展方面走在全国前列。近两年,浙江省委、省政府务实开展智慧城市建设试点,目的就是要通过信息化与工业化、城镇化的融合,促进城市科学发展和创新发展,建设物质富裕、精神富有的社会主义现代化浙江。在
近日,网宿科技发布了APPA(Application Accelerator)企业应用加速解决方案(以下简称APPA)。据了解, APPA是基于网宿的云分发平台,利用飞流Web加速、系统负载优化、网络安全加固三大模块以及完备的支撑系统与服务,帮助企业信息化系统实现效率提升及优化。与传统采用专线或加速设备的方式不同, APPA部署更加简单、覆盖范围更广、可扩展性更强(APPA可对多种终端设备提供加速
本报综合报道 8月29日,目前处于窘境中的夏普宣称,其将在日本削减2000个职位,这一数目大概相当于6%的当地劳动力,目的是为了继续进行公司结构重组。  夏普称此次裁员将于今年11月1日起执行,为期两周,预计遣散费成本将达到270亿日元(约合3.4323亿美元),即平均每人1350万日元。  除了这2000人,夏普在日本的员工数量还将再减少1300人。另外,在明年3月31日前,夏普还计划在海外市场
有媒体爆料,9月5日,小米3伴随着小米电视即将发布。在各种期待之余,有媒体带出了这样的字样:还是1999元?  应该说,小米从诞生第一天开始,就伴随着价格战:两年前,1999元惊天最低价 市场饥饿销售策略一步步奠定了小米在中国手机界的地位。到今年年中,小米暑期促销机陡降300元,再到前不久联手微信社区推出的699元红米手机促销(几天近千万的订购量)。号称中国第一软件工程师的雷军,用的招数几乎都是有
本报综合消息 近日,抢在Facebook上市前夕,雅虎正式起诉该公司侵犯其10项专利,其中涉及到网络广告、隐私、通信以及社交网络等技术。雅虎在起诉书中称,Facebook使用雅虎专利技术增加营业收入,扩大市场份额,但相关研发成本却由雅虎来承担。雅虎认为其蒙受的损失仅靠让Facebook补交专利费无法全部弥补,要求法庭责令Facebook赔偿专利侵权造成的一切损失。  2004年,在谷歌上市前,雅虎
物联网究竟是什么?就其本质而言,物联网是一个广泛的生态系统,涵盖连接到互联网的众多普通物品,这些物品能够自报身份,并将数据传送给同一网络上的其他物品。  物联网的基本架构包括一项跟踪技术,比如RFID或条形码、传感器、嵌入式软件和无线互联网连接。“应答器节点”贴在卡车和药瓶等物品上,以独特的方式向互联网自报身份。通过把几乎各种类型的产品或设备(车辆、施工设备、煤气表及电表、家用电器和自动售货机等)
家电下乡政策今年不会取消  本报讯 近日,商务部部长陈德铭表示将继续扩大内需,家电下乡政策不会取消,将持续到今年年底,有28个省今年将继续实行家电下乡的扩大消费政策。据悉,商务部将推出绿色低碳节能环保便民利民的项目,以利于这些产品能够作为循环经济产品来发展。  移动用户对无线网络满意度下降  本报讯 据iPass调查显示,随着智能手机和平板电脑数量的激增,移动行业的用户对于他们的无线网络服务满意度
与Windows 8之前的版本相比,微软对Windows 8最大的改变之一是对平板电脑等移动设备的支持,其中之一就体现在微软将首次支持基于ARM芯片的设备。很显然,ARM芯片在移动领域的市场占有率让微软不能无动于衷。与x86平台上的Windows 8相比,ARM平台上的Windows 8有何不同?  在微软2月29日发布Windows 8消费者预览版之前,微软已经通过一篇很长的博客详细介绍关于运行
部委  工信部进一步加强通信业节能减排  为贯彻落实国务院《节能减排“十二五”规划》以及《“十二五”节能减排综合性工作方案》,加强生态文明建设,提高资源能源利用效率,构建绿色通信网络,全面实现通信业“十二五”节能减排目标任务,工业和信息化部提出了关于进一步加强通信业节能减排工作的指导意见。  意见指出,到2015年年末,通信网全面应用节能减排技术,高能耗老旧设备基本淘汰,初步达到国际通信业能耗可比
“很多IT服务公司,在某一行业拥有长期项目开发经验后,会比企业更懂未来的发展发向。”北京服务外包协企业协会理事长曲龄年近日在接受本报采访时说,以IBM为例,其为金融业提供咨询或IT服务解决方案,至少要能说出银行业未来十年的发展走向。  近日,IBM全球企业咨询服务部在北京召开发布会时表示,未来5~10年内,IBM咨询将结合同全球企业合作的经验,为行业提供一套特别的端到端解决方案。  “我们希望在短