展会信息港展会大全

全球最大语音识别公司Nuance的浮沉史
来源:互联网   发布日期:2016-08-31   浏览:383次  

导读:Nuance 是全球最大的语音识别技术公司,这十几年里,其经历了无数次起起落落:曾被苹果、Google、三星捧在手上,被绝大多数语音公司为之朝贡。之后却连连遭遇市值暴跌、技术瓶颈、客户流失、离职潮、错过最佳出售时间等,最终不得不从只专注纵向 ......

Nuance 是全球最大的语音识别技术公司,这十几年里,其经历了无数次起起落落:曾被苹果、Google、三星捧在手上,被绝大多数语音公司为之朝贡。之后却连连遭遇市值暴跌、技术瓶颈、客户流失、离职潮、错过最佳出售时间等,最终不得不从只专注纵向深耕算法的技术提供商转型为横向扩展各行业解决方案的公司。

Nuance 依赖症 和 Nuance 恐惧症

雷锋网(搜索 雷锋网 公众号关注)曾多次报道过关于 Nuance 的深度文章,文中指出 Nuance 第一次被众人熟知源于他们与苹果之间的合作。当时被誉为下一代交互系统的 Siri 采用了他们的语音技术后,这家名不见传、闷声钻研技术的公司瞬间被各大媒体相继曝光。其实在与苹果合作之前,他们已经跟多家知名厂商保持合作关系,其技术被应用于手机、电视机、汽车等产品中,其中三星的语音助手S-Voice 也采用了 Nuance 的技术。

由于整个语音技术市场 Nuance 一家独大,技术远超同类竞争对手,使得客户群对其依赖度都非常高。

Nuance 的 CEOPaul Ricci 是硅谷出了名的狠角,为达到目的不择手段。在任期间他主导了 60 次并购,Ricci 极为擅长利用诉讼手段削弱那些具有创新力的竞争对手,以便用非常低的价格对其进行收购,或让它们破产。初创公司 Vlingo 的 CEO Dave Grannan 说到:

和 Nuance 竞争就像传染性病一样,我们在和他们的直接竞争中处处领先,但就当你认为生活充满了美好时,!好日子就这样结束了。

而另一家初创公司 Tellme 的前 CEO McCue 曾提到,很多公司无法顶住 Nuance 的压力,最终屈服,而且这样的事情还在不断发生。

那个时期的 Nuance 拥有绝对的地位和行业话语权,任何与之相联系的公司不得不向它俯首称臣,巨头们对其也礼让三分。

然而,这个傲慢自大的语音巨擘正在面临空前的危机,自己却悄然不知。

语音帝国每况日下

之后,Nuance 在短时间内同时面临一系列的致命问题,而且问题都是连环性的,一处破裂,整个环节都有可能崩塌。

技术天花板

Nuance 的语音技术是以统计推断方法为基础,着眼于音素(音节的声音)和语境来识别话语。在识别方面,Nuance 的算法和专利均领先其他竞争对手。然而语音识别技术并非高不可攀,尤其在 2010 年以后,专利和算法在语音应用场景中的作用越来越小。各家语音的纯识别率逐渐趋于同一水平线,差距不再可感。如果继续深耕识别技术,路会越走越窄,成本与提升的效果远不成正比。

客户流失

就在此时,深度学习空前火热,其被广泛应用于语音技术当中,省去很多语音模型创建环节,使得难度、成本、时间均大幅下降,一大批厂商纷纷涌入这个行业与 Nuance 在同一维度展开竞争。而此时苹果、三星、Google 等公司为了摆脱对 Nuance 的依赖,也开始着力于开发自己的语音技术,Nuance 在技术上的优势逐渐不在,客户也慢慢流失。

核心人才频繁被挖

流失的客户开始聚拢人才,开发自己的语音产品,而挖 Nuance 墙角就是最现成的办法。苹果作为 Nuance 的战略合作方,其挖人动作最为高调,苹果在 Nuance 的老巢波士顿悄悄设立语音技术研发团队,不仅吸纳了为 Siri 服务的语音技术人才,更是将 Nuance 公司的多名高管和高级语音研究人员招募进来,其中包括 Nuance 前研发副总裁 Larry Gillick 以及语音资深科学家 Gunnar Evermann、Don McAllaster 等。

与此同时,Google 为了避开 Nuance 的专利障碍,挖走在 Nuance 工作十年的联合创始人 Mike Cohen,让其担任 语音掌门 开发相应的语音识别技术。有趣的是,小米全球副总裁 Hugo Barra,也曾是 Nuance 的产品经理,于 2008 年被 Google 招入麾下。

核心人员流失意味着 Nuance 的技术壁垒被变相 瓦解 ,大公司对它的依赖不断减小,这对于依靠技术输出来获取收入的 Nuance 来说,无异于灭顶之灾。

错失最佳售卖期

乔布斯曾提出收购 Nuance 的请求,但被 Nuance CEO 一口回绝。业界认为他们当时显然错过了最佳出售期。

之后在 Nuance 进退两难之时,三星和百度也均流露出收购 Nuance 的意向。语音交互替代多点触控已成为科技界人士的共识,语音技术对拥有过亿用户的企业来说,战略意义往往大于其实际价值。但最后收购事项并未顺利进展,分析师指出三星等公司主要考量到了这两个问题:一个是性价比,Nuance 的雇员超过 15000 人,如果进行收购交易规模将在 50 至 60 亿美金以上,因此潜在收购者吞并体量庞大的 Nuance 存在是否划算的问题。其次,三星最初构想通过收购 Nuance 从而在一定程度上限制苹果、Google 在相关业务方向的发展,但现实是各个公司的自有语音技术已经趋于成熟,因此 拿下 Nuance,就可以制约与 Nuance 合作的企业 这句在以前成立的话,现在已成为伪命题。潜在收购者们只好作罢。

回顾 Nuance 这些年的经历,其衰落离不开 技术 两字。首先 Nuance 自己碰到了语音技术的天花板,很难再有大的突破。其次,借着深度学习大潮,使用全新算法的搅局者们的追赶速度远远超出 Nuance 的预想,变得一发不可收。而此时留给 Nuance 的时间似乎已经不多了。

此时,Nuance 只剩一条路可选:转型。

发力消费级市场

鉴于 Siri 的成功,Nuance 自然也对 2C 产品眼馋,于是相继推出语音助手 DragonGo、Wintermute、Dragon Assistant 等多个语音助手应用,但当时的语音助手市场已是一片红海,Cue 的创始人 Daniel Gross 曾说到智能助手市场的局面相当困难,并且充满了未知。Nuance 在C端产品上也并不顺利,其在这三方面处于弱势:

缺乏消费级产品基因:Nuance 多为企业提供基础语音技术服务,与用户的距离相对较远,在把握普通用户需求与苹果、Google 有着一定的差距。

缺乏生态链支撑:Siri 和 Google Now 直接被内置在 iPhone 和 Nexus 手机中,且与双方自有应用配套。

用户对语音助手的接受程度并不高:一方面是因为用户更习惯于触控式交互,其次是语音助手还不智能。C端问答系统的智能程度往往取决于用户在生活场景中产生的数据量以及云计算能力,Nuance 在这方面显然处于弱项。

眼看 Nuance 的C端产品即将竹篮打水,欲想崛起还得继续深耕养活自己多年的B端市场。

企业解决方案服务商

Nuance 相比于苹果和 Google 的优势在于其服务B端客户群的经验,2012 年之后,内部逐渐开始从底层技术输出商转型为企业解决方案服务商,Nuance 成立四个业务部门:

医疗业务部,提供医疗中的病历管理及手册转录服务。

企业业务部,为银行或者电信行业提供客户服务及呼叫中心应用。

移动设备业务部,提供手机与汽车设备中的指令及控制功能、语音查找及短信应用。

图像业务部,提供 MFP 多功能扫描、PDF 以及文件自动化操作解决方案。

医疗解决方案

四个业务部门中,收入最多的是医疗业务部,该部门的业务是为临床专业人士提供语音导航文件系统和应用程序,Nuance 的医疗应用可与其他公司的医师档案记录工具相整合,实现病人在不同临床系统、不同医疗平台、院内院外的电子病历记录完整性,有效提升医师的诊断效率。数据统计称,医生每年使用 Nuance 的临床语音识别技术产品记录近一亿病人的数据,其中 94% 的医疗机构正在考虑或有强烈兴趣使用临床语音识别技术。

医疗业务让让其找到了持续造血的新源头。此外,电信运营商和银行也是 Nuance 的重点客户。

呼叫中心解决方案

企业业务部的一项重要产品是 Nuance Recognizer(呼叫中心自助服务解决方案),全球绝大多数电信运营商、银行均采用了该呼叫中心解决方案,Nuance 语音解决方案每年自动处理超过 120 亿次电话呼入互动业务。随着人工智能客服的兴起,Nuance 也在通过收购 TouchCommerce 等相关公司来紧锣密鼓地布局此项业务,更进一步实现呼叫中心无人化。

移动应用产品

除企业级重型产品外,Nuance 还推出较为常见的语音转文本和输入法软件。此外还针对于客户服务提供了 Nina 虚拟助手、会话式 IVR(忽视语音应答)、托管平台等系列解决方案。虽然语音助手在竞争中处于弱势,但手中的客户资源不容忽视,Nuance 在 2013 年之前几乎垄断了各大国际汽车品牌的车载语音软件市场,包括宝马、奔驰、奥迪等,约 3000 万辆汽车装有他们的车载语音助手 Dragon Drive(声龙驾驶)。

声纹技术

在扩大自己企业业务的同时,Nuance 仍旧不忘其本质:语音技术。近年来,Nuance 研发出最新的声纹技术,我们知道,每个人的指纹都是唯一的,同样,声纹也是人的个性特征。根据人的声音特征,记录和鉴别用户身份。该技术的落地应用可为客户量身定制电话客户服务解决方案,通过分析呼叫者与坐席自然交谈期间的语音内容来验证合法呼叫者的身份,并实时检测已知欺诈者。提升了其所有语音产品的安全性。

给中国公司的借鉴意义

Nuance 经历多次波折后逐渐将其技术整合到服务和流程当中,并独立开发出行业解决方案为客户提供强大的产品支持。 如今,医疗保健、电信、金融、移动应用等行业内成千上万的公司均通过自然语言的交互方式便能利用 Nuance 产品带来的多维度服务。Nuance 也为很多处于转型阶段的语音技术公司起到了一定的借鉴意义。

国内的科大讯飞也遇到和 Nuance 同样的问题:单纯提供技术所获取的毛利远远低于提供服务。底层技术提供商往往容易受到巨头价格战和免费模式的绞杀。这个现象同样体现在云计算市场竞争当中,BAT 在云计算 Iaas 领域中竞争,使得其他厂商很难入内,而 Saas 应用层明显有更广阔的利润和生存空间。因此科大讯飞为部分公司提供底层技术服务,而在人机交互(如手机、汽车、电视、呼叫中心)、儿童教育、国家信息安全传播三大分支领域,为其提供深化的应用服务。

新一轮机遇与挑战

转型后的 Nuance 运营状况还算良好,但此时面临着新一轮挑战。

最新智能语音市场份额统计,Nuance 的营收较以往有所增加,但市场份额已从 2014 年的 60% 下滑到了百分之 31%。由此可以看出,智能语音市场正处于高速增长期,同时竞争也空前加剧,机遇与挑战并存。此外,体量庞大的 门外汉 也加入了这场角逐当中,亚马逊先后收购 Yap,Evi,IvonaSoftware 等语音公司,Facebook 也一举把 MobileTechnologies、Wit.ai 揽入麾下,两者在这一年里分别推出的 Echo 以及 Facebook M 等项目,意在语音市场捞点儿油水。

从目前的趋势来看,机器人的交互系统将会成为语音公司的重要争夺方向。Google、苹果的优势在于用户的生活数据,因此他们在消费级机器人交互系统的博弈中占优。而 Nuance 凭借多年在银行、医疗、汽车等行业的服务经验,手下压有一张垂直领域数据库的王牌。这一底牌或许会为 Nuance 在未来的企业级机器人交互系统战役中,率先建立起他人难以逾越的壁垒。

赞助本站

人工智能实验室

相关热词:

AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港