展会信息港展会大全

Siri背后的故事以及比iPhone更惹眼的原因
来源:互联网   发布日期:2013-01-24 21:38:05   浏览:8887次  

导读:Siri正式亮相前的一次封装会议上,只有有少数人领略到了世界一点一滴的被科技创新塑造而变得更加智能的变动趋势。 Who are you?,苹果高管在和这款语音助手对话时问到。 我只是一个卑微的个人助手,Siri略带笑声应答。 虽然Siri自嘲为卑微的个人助手,但这次...

Siri正式亮相前的一次封装会议上,只有有少数人领略到了世界一点一滴的被科技创新塑造而变得更加智能的变动趋势。

“Who are you?”,苹果高管在和这款语音助手对话时问到。

“我只是一个卑微的个人助手”,Siri略带笑声应答。

虽然Siri自嘲为卑微的个人助手,但这次会议却是Siri的第二次公开亮相。2010年早期,当这款虚拟助手首次登台亮相时,还是一款由24个人组成的初创项目团队打造第三方iPhone应用程序,并且在后来被苹果收编。

在当时,Siri更像是一个狂妄自大的语音助手,并且包含很多个性化功能特征。研发团队对这款语音助手的优化工作多数情况下表现的就像小说作者突然灵光一现。Siri联合创始人Dag Kittlaus和设计专家Harry Saddler细心对Siri进行调教,并且为其准备了众多的背景知识。“她表现的‘超凡脱俗’、‘通宵一切’并且反应‘机智灵敏’”,Dag Kittlaus如是评价。

Siri背后的故事以及比iPhone更惹眼的原因

在被问及健身房信息时,Siri会用一种略带调侃的语气回复,“唉,你好像确实有点肌无力埃”,而被问及“哈尔遇到了什么状况?”时,Siri则会索引Stanley Kubrick 1968年出演的惊悚片“2001:太空漫游”的信息,并且用一种愠怒的态度回应,“我不想说这个话题”。在那个时候,Siri的词库中还会有很多不文明词汇。

这些不和谐词汇在Siri团队被苹果收购之后,也被相应的剔除,即便后续也加入了一些更为新颖的功能特征,但是这款语音助手的天赋却得到了极大的限制。2011年10月份,时隔这家初创团队被1.5亿-2.5亿美金收购的报道传出的16个月之后,苹果正式以官方的身份介绍了Siri这款产品,并且为其加入了更多的语言支持。现在,Siri服务着数以百万计的用户,并且被注入了很多国际化的特征。现在的Siri能够通过语音的方式播报答案,并且被深度整合至iOS操作系统当中,能够和苹果自有的数十款应用程序协同使用,处理一些类似于会议安排、邮件回复或者查看天气等基础任务。而在以前,Siri只能通过文本的形式与用户完成人机交互。

Siri早期版本中的很多天赋如今在苹果的版本中已经难以找到,毕竟最原始的Siri应用已经不复存在,但在受其影响的美国历史上最大的人造智能工程:美国国防部资助的虚拟语音助手项目中可以找到一些线索和答案。

2010年,Siri首次登台亮相时具备与包括Yelp、StubHub以及Wolfram Alpha等在内的42项不同的互联网服务连接的能力,并且从这些信息源处索整合出最详尽的答案,能够帮助用户购票、能够召车,不需要用户另行打开其他应用程序、注册其他单独的服务或者提供电话信息,甚至能够识别出用户的好恶,并且根据用户的个性匹配对应的服务。

在2010年的一次科技会议上,Siri联合创始人Tom Gruber演示了Siri的研究成果:告诉语音助手“我想去办公室附近的一个浪漫的意大利餐厅”,Siri就会从Citysearch、Gayot、Yelp、Yahoo! Local、AllMenus.com、Google Maps、BooRah以及OpenTable中天衣无缝的合并出最优结果,并展示出来。

和其创始人设想的一样,Siri被定义为一个“处理引擎”(do engine),比如允许用户通过互联网来举办会议。而在当时,搜索引擎只能提供呆板的连接,而处理引擎却可以进行一些对话,然后创建一些实际的动作行为。打个比方,当你喝醉酒之后,谷歌搜索可以为你提供确切的回家路线,而处理引擎却可以为你提供切实的召车服务。这家初创公司的初始目的本身就不是搭建一个更好用的搜索引擎,而是建立一个全新的互联网访问模型,一套能够满足用户切实需求的人造智能平台,远非单纯的为用户提供数据信息,最终仍旧依赖个人决断旧有思维模式。如果说搜索引擎定义了web 2.0时代,那么Siri的联合创始人的目标就是定义web 3.0时代。

处理引擎的设计初衷就是方便参与用户日常的生活,建立一套想用户之所想的任务处理规则,并且在用户提问之前就能够给出切实的答案。尽管这种设想和初衷离最终的实现还有很长的距离,但是却为语音助手服务提供了一套全新的解决方案:Siri助手能够在航班延误时赶在用户沮丧之前,抢先拿到备用航班、火车中转以及租车等解决方案。

最初版本的Siri给当今的Siri的未来,以及如何进入到大众电子消费者的生活描绘了一幅非常完美的蓝图,其根本目的在于建立一套人类能力增强以及潜在并且不可或缺的助手模型,能够避免人脑思维的局限性,并且将用户从琐碎繁杂的日常事务中释放出来。

Siri的造梦者们清楚明了的知道苹果当前版本语音助手并没有完全发挥其潜能,“Siri的创世团队看到了未来、定义了未来并且顺利的迈开了通往未来技术的第一步”,最初投资Siri项目之一的风险投资公司摩根塔勒合伙人Gary Morgenthaler如是说到。“被收购之后(苹果)Siri缓慢的商业化进程让我们这些创始团队感到非常的失望。”

苹果目前在使用这项技术方面面临的巨大的压力,尤其是很多竞争对手开始在尝试实现Siri创始团队的想法,并且推出新一代的语音助手服务。Siri的履历折射出了虚拟助手的完美未来,虽然当前苹果Siri助手存在很多缺陷,但未来却将会成为Siri历史中的一个注释。

Dag Kittlaus 认为,“一个更为智慧、绅士的哈尔正在赶往通向主流用户的路上。Siri不过只是最初的弄潮儿,只不过后来的发展并没有沿袭当初的设想。”

NERD CITY(呆子城市)

哈尔的银幕首演35年之后,在美国国防部将一些科幻小说中的元素搬至现实生活中,并且赋予一些超乎寻常人理解能力的特性之后,其地位已经远超卢卡斯或者斯皮尔伯格。

2003年,美国国防部斥重资强化美国国防先进研究项目局,并且由斯坦福国际研究所牵头,组建一个5年期的500人规模团队,打造虚拟助手服务,寄希望通过软件的形式帮助军事指挥官解决信息负载和办公室杂务等问题。尽管这并不是项目任务,而是一项援助性活动,但是这项助手项目(CALO)却给Siri带来了灵感。

美国国防部在该项目中总共投入了1.5亿美金,联合了数百名顶尖的人工智能专家,就为了一项多数联合实验室都只能梦想的项目:让计算机具备野外生存的能力。在Nerd City(取自斯坦福国际研究所研究院的绰号),军队工程师被授命研发一项基于PC并且能够观察人类行为的智能助手项目,所有的人员配置、项目以及话题都和这个智能助手息息相关。CALO项目首席研究员David Israel认为,“从任何角度来说,这都是人工智能历史上最为壮观的项目”。

至少对于一些人而言,联邦政府在对待一个类似9岁小朋友的科学幻想方面表现的尤为严肃、认真。

“CALO项目归集在一起的时候,很多人会觉得这种人工智能不过是在浪费时间,尤其是经历了无数次的失败之后,人们对这类项目的质疑纷至沓来。”,斯坦福大学副教授、科技预言家Pail Saffo说。

不管反对者如何质疑,CALO却实实在在的证明了科学的胜利,并在几十年之后实现了项目重组,将当初人们认为极为复杂的合作组成了一个独立的人工智能学科。

与此同时,CALO也反映了机器能够通过其适应性的设定来完成实时信息的捕捉,就像人类一样。此前,人工智能软件必须通过外部的设定才能使用,意味着机器的学习算法需要注入大量的数据,然后才会根据这些数据来判断如何进行处理。而现在,CALO项目摈弃了这种方式,让机器能够自身收集的信息,更加灵活的进行任务处理。

斯坦福实验室在将未来带到现在的活动中完成了一次伟大的创举。1946年,斯坦福大学受托展开一项“对社会益处”(the good of society)的研究,并建立了该实验室。1976年斯坦福实验室正式独立运营,并且持续至今。该实验室主要进行一些由政府部门和企业资助的研究项目,然后将这些技术提供给一些有想法的初创企业。包括喷墨打印机、LCD液晶显示屏这些科技成果都出自斯坦福实验室。

Menlo Park 实验室同样凭借其研究员在计算领域声名远扬,其中硅谷传奇中出现的Doug Engelbart正是20世纪60年代计算机鼠标产品的先驱者,这名传奇大师还预见了当今社会用户习以为常的设备。

同样是来自Menlo Park 实验室的工程师Adam Cheyer,最终推出了Siri的早期模型。而在谈及Doug Engelbart时,Adam Cheyer认为这位大师不仅仅因为独创性而出名,更因为其“以人为本”的科技理念而德高望重。

Doug Engelbart认为机器应当用来提升人类的智利和能力,并非试图取代人类活动,而是尝试着通过设备、硬件和软件让当前的人类活动更加高效。

当很多人将目光聚焦在任务列表上的琐碎杂物时,Adam Cheyer却敏锐的捕捉到了虚拟助手的机遇。90年代早期Adam Cheyer就在计算机硕士研究项目中建立了小型军事助手原型。而这款原型设备当时被命名为Cheyer的厨房帮手,能够跟踪冰箱中食物的容量,并且在容量不足的情况下有序的发布到互联网上。如今,这个概念刚刚出现在CES2013展会上的三星智能冰箱之上。

在斯坦福实验室,Adam Cheyer负责组装来自CALO项目总共27个团队的研发部件,从而形成助手整体,并且每年都会对这些助手所掌握的信息进行年度测试。虽然这款研究级别的虚拟助手在被安装至办公室PC时仍然存在一些问题,但是已经可以完美的完成一些一度只有人类助理才能够完成的工作任务。

如果需要临时取消会议,CALO可以了解单个项目中每个人所扮演的角色,并且能够辨别是否取消会议,在有需要的情况下,甚至可以重新安排会议,发放新的会议邀请以及确定会议室。如果会议如期举行,CALO能够快速的整理会议所需的文件和邮件,并且会聆听整个会议,之后会快速打印出会议纪要,并对发言情况进行标注。另外,CALO还能够将会议记录和发言编订成册,自动化分拣报告以及其他日常任务。

在对CALO进行训练的同时,Adam Cheyer还会抽出时间来协助Vanguard项目,并且顺利于2003年上市,致力于帮助德意志电信、摩托罗拉来调查、分析一些新产品如智能手机的前景。Vanguard项目后期也推出了自己的助手原型设备,虽然功能方面比CALO有限,但是相对更加灵活。

这款原型后来被时任摩托罗拉总经理的Dag Kittlaus相中,而他就是Siri的联合创始人之一。

Dag Kittlaus是一个土生土长的挪威人,拥有一副永远长不大的娃娃脸,而且极富冒险主义精神,热衷于参加跳伞这类极限运动,也是合气道黑带选手,还是一个科幻迷,尤其钟爱为《2001:太空漫游》执笔的作者Arthur C. Clarke的作品。

Dag Kittlaus试图说服摩托罗拉收购Vanguard科技失败之后,于2007年从摩托罗拉离职,并以常驻企业家的身份出现在斯坦福实验室。随后不久Dag Kittlaus就和Adam Cheyer以及其他几个同事远赴加利福尼亚,尝试从CALO和Vanguard项目中找出优质的点子来组建一家初创公司,进而促成了Siri这个项目。

Siri诞生于旧金山一座宁静的城镇半月湾的一家名为Cypress的酒店。就像CALO和Doug Engelbart的以人为本的理念一样,Siri的最大特点就是能够将人类工作的压力降到最低水平。而这个助手项目的绰号当时被取名为哈尔(HAL),口号则是“HAL’s back -- but this time he’s good”。

未完成的革命

虚拟助手早就证明了硅谷梦想家们塞壬之歌式的理念:打造一款更加智能、人性化的哈尔机器人。

1994年,野火通信推出了一款基于电话的助手产品“Wildfire”,能够处理短信息、打电话以及检索语音邮件,获得了业界的一致好评,但是多数叫好不叫座,即便是其活泼的表现非常让人着迷。几年之后,微软Office助手Clippy:一个让办公室无处不充满着懊恼的回形针助手诞生。最终,Clippy被时代杂志评为50大失败创新之一。1998年,General Magic的承诺Portico服务将成为一款具备连接互联网和手机的能力的语音助手服务,可用于阅读邮件、发送信息以及一些其他的任务。悲催的是,4年之后这家公司终止了该项目的研发,并且宣布破产倒闭。

如果要找一个对虚拟助手来说既是正确的时间,也是正确的地点,那这毫无疑问会是2007年的秋天。这一年,iPhone带着更快的无线连接速度、更好的语音识别以及优秀的云计算等诸多特性公开亮相,大量的web服务蔓延至iOS平台,为语音助手提供了超大的舞台。

在去月半湾之前,这批斯坦福实验室成员亲历了iPhone手机的发布,并认为在未来会形成一个由iPhone主导的人际网络,而且消费者对在小尺寸触控屏上告诉语音助手应该做哪些事情的这种依赖性会与日俱增。因此,以iPhone应用形式出现的语音控制助手服务毫无疑问是一种完美的解决方案。

这群有抱负的企业家,还有一个优势就在于能够近距离的接触到CALO项目的核心技术。基于1980年美国国会公布的一项法案,斯坦福实验室应免费向企业提供这些技术,而可以从政府获得专项资金支持。做为回报,初创公司会对斯坦福实验室提供基于CALO项目的核心软件授权。

虽然Adam Cheyer并不确信CALO的研究成果能够带来切实的商业利润,并且也不太愿意离开斯坦福实验室,不过Dag Kittlaus最终说服了这位“创新灵魂伴侣”共同创业,并将公司取名为Siri,Dag Kittlaus担任首席执行官,联合创始人Gruber担任首席技术官,Adam Cheyer则任职工程高级副总。

Siri的三位联合创始人要求每一个潜在的应聘者阅读麻省理工学院教授Michael Dertouzos撰写的《未完成的革命》一书,主张“以人为中心的计算”和“服务于用户,而不是用户服务”的设备理念。如果应聘者不同意Michael Dertouzos的观点,那么就和Siri的公司文化相违背,被认为不适合这里的工作。

一旦通过面试,Siri的雇员都会分到一个空白的相框,用于装裱最能够激励自己工作的照片。Adam Cheyer在自己的相框里嵌入了一幅一直致力于“以人为本”科技理念的传奇大师Doug Engelbart的照片。

2008年早期,Siri从投资人手中拿到了850万美元的启动资金,在此之后的数月公司的取得了“突破性的进展”早期天使投资人Morgenthaler如此评价。来自Menlo Ventures 的投资合伙人Shawn Carolan在回忆Siri时,同样认为“每一次董事会会议都是一次突破。”

几位创始人在自己一手设计的人工智能启动营中甄选合适的Siri原型机,其中一个重要的目的是为了让智能助手更好的理解、解释以及回答问题查询。在被问及问题是,Siri会在远程数据中心处理信息,将用户的语音问题传输至服务器当中,语音识别软件可以转述这些提问。然后Siri就会读出这些问题的要义——这种技术被计算机科学家称之为语言处理技术。人们可以有数十种提问的方式,虚拟助手都可以轻易的推断出语句的含义,比如“我想吃一点羊角面包”、“附近有面包店吗?”、“一些法国高点就好”,但是所有的问题集中到一个点上的时候,就需要高度复杂的算法来计算出相同的结论。

通常,传统并且容易出错的自然语言处理解释主要表现为断章取义。但是Siri放弃了这种思路,而采用了一套由Adam Cheyer和同事设计的突破性处理算法。相比传统的语言建模概念,Siri的系统可以模拟出真实的语言环境。在被问及“我想看一个惊悚片”时,Siri会迅速识别到“惊悚”这个词语,而不是分析主语、对象和动词之间的相互关系。

Siri能够映射问题内容到一个潜在的动作领域,然后基于对真实世界中物物相连关系的理解,甄选出最合适的动作(比如,Siri知道一家给定参观的评分、地址以及一系列价格相关信息)。Siri也会向用户询问一天内任意时段的详细信息、用户偏好以及地点,然后作出相应的回复,或者提出跟多的细节需求,细化问题,为提供令人满意的结果做保障。

设想一个嘈杂大厅里的迎宾,类似“closest coffee shop”这样的提问可能被识别成“closest call Felicia”,但是考虑到“closest”这个词更有可能是形容一个地点而非某个人,而通常情况下客人更有可能向门童提问用餐小费的问题,迎宾则可能会推断出客人想要喝杯咖啡。Siri同样也是如此,并且能够识别到使用者发出的一些关键性词语,而不需要完完整整的听到每一个词。为了避免这个过程中的误解,Siri偶尔也会要求用户通过文本的形式进行确认。

当需要提供咖啡馆信息时,Siri将会从40个web服务中收集数据并提供完整的答案,而之前的虚拟助手却只能通过单一的方式进行深度训练,在提供相对单一的答案。在这方面Siri的优势就在于可访问应用程序的API或者访问第三方程序交互界面的权限,从而变身为一个无所不知的智囊团。

早期阶段,Siri的开发者发现虚拟助手服务可无限制自动化处理常规任务,因此设想利用API来搭建一套允许Siri访问任何web服务的架构,进而强化处理引擎的数据库。但实际上Siri的创始人都心知肚明,这些人工智能助手无论最后是个聪明人还是个大白痴,都会是一个巨大的成功。

Dag Kittlaus和Saddler经过集思广益,整理出了一切用户可能问及Siri的问题,并且设想提供一套特殊的个性化副本,能够在安装之后让Siri回答一些令人讨喜的大难。与此同时,由于Siri能够辨识出人类语音的一些细微区别,其创建者也希望未来能够打造一套可以模拟人类个性的语音助手。根据Dag Kittlaus的介绍,未来有一天在被问到“哟哟,你在播放什么电影,老兄?”时,Siri能够回复到,“嘿,哥们看看伊斯伍德的新电影”。

2010年2月份,在Siri应用程序发布3周之后,Dag Kittlaus收到了一通神秘号码的来电,而这通电话正是来自于时任苹果首席执行官的史蒂芬·乔布斯,双方约定第二天举行一次会晤。

Siri的联合创始人在乔布斯位于帕洛阿尔托市的家中进行了长达3个小时的会谈,讨论处理引擎的未来以及人们接受这些机器程序的可能性。随后不久,苹果以迅雷不及掩耳之势受够了这家年轻的初创公司。

Dag Kittlaus 在回忆中提到,“乔布斯将Siri智能助手描述成语音识别服务—如何使用这项技术来创建一套适配iPhone的用户界面—一度是乔布斯和Scott Forstall所感兴趣的话题。而他告诉我们这个故事实际上是想表明Siri创始团队所做出的简单对话交互方式让苹果的问题迎刃而解。”

Verizon同样也是如此看待这个问题。2009年秋天,在苹果接洽Siri团队之前的几个月,Verizon和Siri签署了一项合作协议,试图将Siri作为所有新一年度发布的Android智能手机的默认应用程序。不过在Siri团队被收购之后,苹果却坚持这项服务只能够由自己独享,直接灭掉了Verizon的幻想。在这项交易中,苹果最伟大的地方就在于避免了Siri成为竞争对手谷歌阵营智能手机的卖点之一。

Siri是目前唯一一款以第三方应用身份存世仅两个月的应用程序。两个月之后,Siri就永远的成为了苹果的业务之一。

Dag Kittlaus将这种状况描述成“你既可以将这理解成故事的开篇,也可以理解为故事的结局。”

"人造智能孤儿"

Siri被收购之后,24人的创始团队随之移居库比蒂诺总部,苹果也试图精心修补收购到手的Siri的不足之处。

虽然苹果为Siri加入了很多新的功能,但是也剔除了以应用形式存在的Siri的很多功能,并且屏蔽了很多Siri数字大脑赖以生存的外部服务。其中作为2010年Siri上市初期核心功能的餐馆预订服务,最终于2012年被取消掉。

业内人士称,苹果当时的规模已经无法轻易的让Siri同时处理多线程任务,尤其是合作方也只能提供一些简单的服务,而让这些企业来代理世界一流企业的业务从任何角度来讲都存在超高风险,因而需要大量的律师、会议以及电子表格来进行成本和风险评估。即便是苹果在当时有能力将Siri和大量的第三方服务对接,精益求精的乔布斯也不会允许这种事情在短期内发生。

苹果这样考虑还有一个重要原因是因为想照顾到大众用户的需求,而不仅仅只是满足精英认识的需要。由于需要为全球100多个国家进行本地化适配,因此整合进程也就相对缓慢了下来。团队面临的现实问题就是为Siri提供几十种语言数据。要知道让一项算法理解人类语言,不仅是一个巨大的挑战,而且需要花很长的时间。这也是为什么像中文Siri要晚于其他语言版本上市的重要原因之一。

熟悉早期版本Siri的用户都会抱怨苹果一丝不苟的通过外观和样式来隐藏Siri本身还应具备的其他一系列的功能特征。为了避免用户的失望,早期Siri应用会提供用户一些提问指南,但是整合至iOS操作系统后,全新的布局和功能都和用户的想象存在出入,即便是当前版本能够处理一些特定的任务子集。苹果给Siri取得口号叫做“你所想的都是指令”(Your wish is its command),但最终的结果却并不是用户所想的都能够进行语音控制。

与此同时,苹果还必须面对Siri时常变卦的现实,尤其是在一些高频使用场合。语音识别软件在嘈杂的环境中依旧不够灵敏,在解码蓝牙耳机发送的低质量音频时也同样存在问题。不过由于越来越丰富的数据和优质的人声模拟技术的出现,这种问题将会被很好的解决。

现在,外界对苹果Siri助手的评价颇高:投资银行派杰(Piper Jaffray)在去年12月份因为Siri能够理解91%的查询以及高达77%的回答正确率,已将Siri的评级从原先的D级上调至当前的C级。

然而公司政治文化分为对Siri的威胁也明显存在,因而也很有可能成为公司内部斗争的牺牲品。因此斯坦福教授、未来学家Saffo将理解苹果公司内部运作的难度就像“尝试理解朝鲜”一样困难,并且认为未来Siri很有可能成为苹果公司内部的一款“人造孤儿”产品。

到目前为止,Siri的3位联合创始人中仅Tom Gruber留在了苹果公司。Dag Kittlaus于2011年苹果重新发布Siri后的第三周离职,Adam Cheyer也于去年离职。负责Siri的Keynote环节的iOS软件部门掌门人Scott Forstall也于去年被炒鱿鱼。史蒂夫·乔布斯更是在Siri重新登台亮相后的第二天就长辞人世。Luc Julia在Dag Kittlaus离职之后临时接替了Siri部门负责人职位10个月之后,也于2012年离职。

一个更高的姿态

Siri可以提供世界一流的人类自然语言演讲方式的理解能力和对世界不同地区信息整合的能力。这种模型正在激发越来越多的人造智能工程师和企业家致力于打造资助版本哈尔机器人的努力。

很多虚拟助手服务目前已经具备了提供很多早期版本Siri和更早的CALO项目所具备的能力,包括一些被苹果逐步放弃,而在早期Siri版本中却附带的影评和餐馆预订功能。

鉴于Siri的成功,很多硅谷初创公司现在都在奋力挖掘CALO项目的剩余潜力,进而打造一些用于特定领域的虚拟助手服务。Desti就是一家专门提供旅行相关的人造智能助手业务的初创企业;Lola则偏向于Siri相关的银行业务。

单就2012年,类Siri的服务就诞生了数十款。三星也推出了自主品牌的S-Voice服务。Nuance则是一家语音识别软件服务提供商,目前发布了一款名为Nina的“Siri for app”应用。IBM目前也在尝试为旗下超级计算机Watson植入可服务物理学家、农民乃至华尔街交易员的类Siri服务。谷歌在Verizon的撮合不成之后,最终也推出了自己的语音助手服务Google Now。

“这种创意已经不再是简单的提个问题,然后得到答案,而是这些助手可以协同人类活动,帮助用户去处理一些日常的任务”,一位负责谷歌移动搜索业务的总监Scott Huffman如此评价道语音助手业务。

未来学家和研究人员预测向Siri和Google Now这样的语音控制软件在未来将可以帮助人们去掌握和理解一些新技术的特性和使用技巧。

Saffo介绍,“我们现有的用户界面正在离预想中的产品越来越接近,整体大方向是朝着更加友好的人际互动方式转变,机器在人类生活中有时候甚至会扮演着核心的角色。”

Siri在语音助手业务方面开了个好头,谷歌助手在这方面的成就更为显著,甚至在被提问之前应用就会提供给用户一些参考信息,比如为球迷及时的更新比赛动态,提醒用户因为交通问题尽早散会等等。2010年,谷歌董事长Eric Schmidt曾告诉华尔街有报记者,“越来越多的人们希望谷歌告诉他们接下来需要做什么事情。”

几年后,当用户在逛商场时,虚拟助手就可以告诉用户哪个地方可以买鞋。当促销员在迎接顾客是,虚拟助手就会对用户耳语,告诉你休闲鞋必须是牛皮材质,也会提醒你当月的消费预算。如果用户过度挥霍,那么虚拟助手就会主动与银行联系,并解决这些问题。当用户在玩游戏时,助手服务很清楚接下来的博物馆参观活动,就会为用户更新一些展会的近况。虚拟助手甚至还可以利用情感识别技术分析用户的心理活动,然后在用户脸部表现沮丧的时候讲一个靠谱的冷笑话。

人类的路在何方?

和很多人一样,Siri的早期投资者Shawn Carolan设想人类在未来将会具备更加高效的生产力,“将每一件事情记录下来,然后用30秒的时间概括15分钟要做的事情,告诉虚拟助手你的意图,然后坐享其成,我们的生产力至少会提高30倍”。

实际上,如果苹果可以全面启用处理引擎的特性,采纳Siri早期架构的优势,全面的访问各种web服务来提升虚拟助手的能力,Siri早已具备完成各种复杂的任务处理的能力。

Morgenthaler则是指责苹果使用这项技术的方式,Siri可以进行“亚马逊在购物方面的数千种活动”。但是在苹果麾下,Siri却只能进行一些订票、订花或者提供一些时尚建议,成为前CALO项目总监James Arnold口中‘iTunes即一切’的妥协产物。实际上Siri的初创商业模式是在用户通过虚拟助手购物之后进行分成,假如苹果也采用这种方式,毫无疑问会获得大量的现金收益。

James Arnold看好虚拟助手的智力均衡特性。现在,超强的记忆力在虚拟助手可以代为记录姓名、日期和其他一些细节的情况下已经不再有优势,基于虚拟助手优秀的识别能力,每个人都将会拥有这种记下一些与法律按键或者病例相关,很重要但却不常见的信息的能力。

“未来的虚拟助手可能会让人们不再需要考虑太多问题,也不需要尽全力做某一项事情,生存方面的事物不需要再考虑太多,而只需要将更多的目光放在对这个世界的探索之上”,Dag Kittlaus设想。

虽然这些事情处理引擎都可以高效的完成,但也会衍生出一些明显的风险。一位研究伦理和新兴技术的研究员Evan Selinger认为,生活中摩擦的减少将很容易让人们的思维僵化,程序化,“数字侍者最终会成为数字霸主,而我们似乎从来就没有彻彻底底的认识其全貌”。

过分的智能化的算法也会让智能助手轻易的掌控人们的坏习惯,然后比我们变得更坏。比如,广告商控制虚拟助手之后,其给出的建议很有可能导致人们暴饮暴食或者过度消费。而妻子也会因为虚拟助手的存在,不会因为丈夫的身体条件去干涉饮食习惯。

生活中的刺激食物或者苦力能够保持让人们坚持追求更有价值的利益,而虚拟助手却是让人们进入到一种更加没有自我约束的状态。正如数学家和哲学家阿弗烈·诺夫·怀海德所说,“进步与否取决于思考与否”。

而至于如何进步,这也可能是为数不多并且是虚拟助手所无法回答的问题。

赞助本站

人工智能实验室

相关热词: Siri 苹果 iPhone

AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港