IBM搭上无人驾驶汽车

发布时间：2016-06-27

分享到

上周五，美国华盛顿的街头出现了一辆名叫“Olli”的车子。外形虽四四方方、中规中矩，但四角圆润的设计让Olli看起来还是蛮可爱的，不过你能猜到它是一辆无人驾驶汽车吗？

上周五，美国华盛顿的街头出现了一辆名叫“Olli”的车子。外形虽四四方方、中规中矩，但四角圆润的设计让Olli看起来还是蛮可爱的，不过你能猜到它是一辆无人驾驶汽车吗?

IBM联合Local Motors推出的olli无人驾驶汽车

Olli是由IBM和汽车设计公司Local Motors联合推出的无人驾驶汽车，它最多能容纳12名乘客，车子内部还装有模拟人类语言的发音装置，旅途中你可以向车子发出各种各样的提问，比如说， “还有多长时间到目的地啊?”，“你为啥停车啊?”等等。千万不要害怕Olli会是个暴脾气的大爷，相反它是个脾气很温顺的伙计，基本可以做到对答如流，有问必答。知道Olli为什么这么聪明又贴心吗?这一切都要归功于车内搭载的IBM Watson认知计算平台。

Watson是什么?

Watson的名字取自IBM创始人托马斯·约翰·沃森，可谓“一站成名”。5年前，Watson入围了美国CBS「Jeopardy!」(中译：危险边缘)益智问答游戏的总决赛，在不联网的情况下，完全处在与人类日常的环境当中，去听、理解、并抢答，最终以77147分的成绩战胜两位人类选手，赢得头奖100万美金，成为该节目最新出炉的纪录保持者。(现场实录，戳下面视频就看得到哦!)

既然Watson这么厉害，那它到底是什么?Watson是IBM推出的认知计算平台，它利用自然语言处理和机器学习技术来挖掘大量非结构化数据内含的重要价值。

众所周知，传统计算解决方案起源于20世纪40年代，以数学原理为基础，基于一些规则和逻辑进行编程，以便导出数学上的精确答案。传统计算解决方案通常遵循一种严格的决策树方法，但面对如今海量的大数据，以及基于证据决策的更为复杂的需求，这种严格的方法通常无能为力，或是无法跟上可用信息的累积程度。

简单来说，Watson的技术核心在于其认知计算功能，它有如下三个特点：

对自然语言的识别。Watson可以理解人说的语言而不只是关键字;

对非结构化数据的处理。比如数据库中的数据有一定的格式，属于结构化数据。而一篇论文一篇博客没有固定格式，因为目前计算机只能理解结构化数据，因此面对人类个性化的作品，它完全“束手无策”。但具备认知计算功能的Watson不一样，它可以阅读，理解并学习世界上存在的海量非结构化数据;

机器学习。Watson会随着数据的积累和人的训练越来越聪明。

目前我们所接触到的新闻报道、研究报告、社交网络、企业系统信息等80%的内容都是非结构化的数据，Watson更像是钢铁侠Tony Stark的个人助手贾维斯，它能听懂你说的每一句话，可以和你聊各种话题，针对不同问题给出多种解决方案。

Watson + 汽车=?

其实通过前面的介绍，我们不难理解人工智能和认知计算之间的异同。人工智能重在研制一种能够实现人类认知功能的人工机器，而认识计算则更多在研究可以模拟人类的认知功能的计算原理和方法。既然现在包括英特尔、高通、英伟达在内的芯片供应商都在基于深度学习的人工智能领域倾注了相当的精力和财力，那显然 IBM有了Watson这样的认知计算平台，肯定也不会放弃在汽车领域秀肌肉的机会。

今年1月份的北美国际车展上，通过一段视频，IBM展示了其对自动驾驶汽车及车联网技术的畅想，而开着一辆配置了Watson服务的车子到底有着怎样的体验，通过这段视频，我们也真切地感受得到。

视频中，一名男子边开车边和Watson闲聊，而Watson通常会将信息直接显示在车载娱乐系统上。Watson控制着音乐播放系统，它会告诉你最近你都在听这位歌手的哪些作品，他/她在附近是否有演唱会…当然Watson还会根据实时天气状况规划行驶线路，为你推荐附近的商场或参观。整个对话的气氛非常轻松自然，Watson不仅对答如流，偶尔也会直言不讳地说出一些有见地的观点来。

按照IBM官方提供的信息，由于Watson是完全基于云端的服务，因此它不会控制类似转向、防碰撞等车内重要的子系统，所以你也完全不必担心一旦断网，车子会朝着路边的电线杆撞上去。而且Watson具备自然语言处理能力，它远比依靠手机进行操作的CarPlay和Android Auto自带的语音识别功能强大的多。

IBM Watson的云端服务器

年初在接受记者采访时，IBM认知解决方案负责人Adam Steinberg表示，“IBM正在和几家主机厂商谈合作事宜，但具体名录暂时不方便透露。尽管Watson需要强大的芯片处理平台支持，但现有各品牌的车机系统适配都没有问题”。不过现在我们已经知道本田、斯巴鲁、Local Motor已经和IBM达成合作协议，将利用Watson的认知计算平台改进斯巴鲁的「EyeSight」安全驾驶辅助系统。而IBM和Local Motors合作开发的第一辆无人驾驶车Olli也于上周四开始在首都华盛顿正式运营。今年三月，IBM宣布将为本田F1赛车配备了Waston平台的相关技术。

IBM联合Local Motors推出的olli无人驾驶汽车

此外，IBM还公布了一项主题为「人车新关系」的调研结果。该调研对全球16个国家超过16000名消费者进行了问卷调查，询问了他们对“未来10年如何使用汽车”问题的看法。结果显示，除了自动驾驶，消费者最感兴趣的是具有自我能力的车子，即能够自动驾驶，不用车主干涉即可前往4S店维修，车内认知计算平台能够学习并模仿驾驶员行为习惯，了解车子和周围环境的基本特征…

可以预见的是，IBM联手Local Motors推出的第一台无人驾驶汽车olli，即是IBM对未来在汽车领域发展的探索，同时也是对Watson认知计算平台大规模商业化的测试准备。 IBM 物联网事业部副总监Bret Greenstein认为这是一种全新的人车互动的方式，这也是人与车建立互信机制的实验。毕竟当你想到你乘坐的车子是机器在开的时候，心里犯嘀咕或者有紧张情绪在所难免，而Watson所扮演的角色在这场实验中至关重要。

我们先尝试着推测下Watson会采取哪些有效措施，来改变消费者乘坐无人驾驶汽车体验，打消乘客的恐惧心理，甚至让整个过程更愉悦一些。

1. 别怕，无论你问了多么蠢的问题，Watson都会搭理你;

破冰的最好方式是把Watson当成出租车师傅，你完全可以像和Siri或者Alexa对话一样和Watson聊天。告诉它，“Watson，我想去三里屯SOHO”。可能很多时候在搭出租车的时候，你会一言不语，但和Watson在一起你完全不用担心自己的问题很蠢。你可以问问它，“Watson，你为啥在这儿停啊?”，“前头有事故了么?”或者“明天天气怎么样啊?”。其实这种随心所欲提问题的方式可以增强乘客的安全感，也会提高人车的互信程度。

2. Watson得了解乘客的心思;

其实不光是你的问题对车子来说是重要的数据，乘客的语气同样值得推敲。假设你听起来有点紧张，可能是因为你在担心车子开得太快了。这个时候，觉察到乘客情绪变化的Watson要开始减速了。IBM希望每个走出olli的乘客都面带微笑，那是不是Watson还得学点逗人开心的绝技?

3. Watson得保证每位乘客不迟到(当然也要灵活变通);

当你早上走进olli，告诉Watson你需要在9：15到达单位，根据后台储存的用户数据，Watson马上会知道该在哪里停车。假设车内还有四位同行的乘客，Watson会根据所有人的目的地和通勤时间规划路线，保证大家按时到岗。可能有时候你想在沿途的干洗店停车把要洗的衣服送进去，但 Watson会综合考虑所有因素(比如中途停车会迟到)，可能会建议明天早10分钟接你。

4. Watson得告诉乘客仪表台上亮起的红灯是啥意思;

Greenstein在接受采访时曾提到，IBM目前正在和北美、欧洲、亚洲的主机厂合作，预计在1~4年内把基于Watson认知计算平台打造的车联网技术投放市场。除语音交互、自动驾驶、简洁的用户体验之外，很多车企表示希望能使用户车辆的维修和诊断体验更好些，特别是当故障出现时，不只是亮起红灯这么简单。

其实有了Watson，很多小白司机和车机电脑的距离完全消失了。一旦发现车上有警示红灯亮起，你可以直接问Watson，“Watson，这个红灯亮了是咋回事儿啊?”。利用机器学习和内嵌的传感器，Watson可能会预测问题所在，然后它会问你，“需要我帮你在4S店预约维修吗?”，这样的功能的确很贴心。

Watson是怎么工作的?

看过Watson在汽车上的应用之后，你一定很好奇olli无人驾驶汽车上的Watson是如何跟乘客对答如流的，它又是如何通过学习变得更聪明的?我们都知道，Watson及其认知能力可以反映人类专业知识中的一些关键认知元素，这些系统能够像人类一样思考并推断问题。人类在理解某件事情并进行决策时，会经过四个关键步骤：

「观察」，观察可见的现象和有形的证据;

「推断」，根据已有知识来理解所见之事，然后就其中的含义做出一些假设;

「评估」，判断某个假设的对错;

「决策」，选择最佳选项，并据此采取行动。

经过观察、评估及决策这一过程之后，人类将成为专家。与此相同，Watson等认知系统，也会使用类似的流程对读入的信息进行推论。但优于人类的是，认知计算平台能够高速、大规模地进行这个流程。

Q: Watson是如何理解问题并提出解决方案的呢?

前面已经提到，目前我们接触的80%的信息都属于非结构化数据，而Watson使用自然语言，由语法规则、上下文环境与文化约束。自然语言的特点是含蓄、模糊、复杂并且难以处理。人类语言难以理解，某些习语更是十分具有挑战性，更别提同一种语言各地还掺杂了大量的方言。当谈到文本时，Watson不仅像搜索引擎那样进行关键字匹配或查找同义词，而且会像人去解读文本。它会从语法、关系和结构上进行断句，辨别文本的语义和含义。此外，Watson还能够理解上下文环境，尝试解读使用者话语的真正内涵，利用这种逻辑来提取合乎逻辑的回应，并且利用更为广泛的语义模型和算法，来推断可能的答案。

Q: Watson又是如何学习的呢?

当Watson在某个特定领域开始工作的时候，它会学习相应的语言、术语以及该领域中的思维模式。以癌症为例，癌症有许多不同的类型，每种类型都有不同的症状和治疗方案。然而除了癌症，其他疾病也可能出现类似症状。治疗可能会有副作用，并由于多种因素影响，副作用因人而异。Watson会基于医疗实践和该领域内多达数千页的最优秀技术文献进行标准评估，由此Watson能识别最佳记录方案，以供医生在为患者进行治疗时选择。

在专家的指导下，Watson会为“掌握”某个特定领域收集所需知识，我们称之为“知识语料库”。语料库收集从装载文献的相关部分开始。语料库构建还需要一些人工干涉，这样才能对信息进行精选，并且摒弃所有对问题领域而言所有过期的、欠考虑的或者是不重要的信息。接下来，Watson会对数据进行预处理，构建索引和其他元数据，以便能够更高效地利用内容。与此同时，Watson会创建一个知识图谱，以便帮助更准确地回答问题。在摄取语料库之后，Watson需要接受人类专家的培训，学习如何理解信息。为了帮助Watson学习如何最佳响应，并且获得发现数据模型的能力。

Watson合作伙伴和专家会通过机器学习方法来训练它。专家会把训练数据以基本问答形式上传到Watson。这并非意在为Watson提供所有问题的明确答案，而是教会它这个领域中数据含义所对应的语言模式。在接受了问答训练之后，Watson会通过持续交互继续学习，用户和Watson之间的交互会定期由专家进行审核，并将反馈输入到系统中，帮助Watson更好地理解信息。同样，新信息发布后，Watson会进行更新，以便更够不断适应任何特定领域中知识和语言阐释方面的变化。

Watson并非成熟的认知计算平台

只要看过5年前的那场决赛，Watson的表现任谁都会为之一惊。但不可否认的是，把Watson变为商业中实用工具的路，IBM走得并不顺。现在 IBM并没有把Watson作为一个整体的认知计算平台出售，也就是说我们今天谈论的Watson已经不再是当年参加Jeopardy决赛拿下头奖的 Watson了，它的功能被拆分成像语言识别服务等40个不同的部分。商业团体可以根据自己的需求付费租赁，由IBM开放不同功能对应的API端口。

有批评人士指出，并没有证据指出IBM在过去的五年里利用Watson的认知计算平台做出了什么值得骄傲的成绩，相反传统IT业务的缩水让IBM急于投入到新兴云技术平台的搭建，而IBM借助的依然是Watson5年前Jeopardy决赛“一站成名”的光环。

目前对IBM最大的挑战在于，Watson的认知计算能力当面对远比竞赛题库更复杂的的信息时，能否给出有意义的回答。对某些客户而言，Watson的表现似乎并不尽如人意。

三年前，美国德州大学安德森癌症中心开始尝试训练Watson来辨别病人的不同症状，帮助医生进行更好地诊断和提供较妥帖的治疗方案。按照德州大学医学院教授Lynda Chin说法，“Watson并没有如预期般表现出色，要实现之前计划的效果很难。事实证明，要让一台赢得竞赛的超级计算机一夜之间变成肿瘤学专家，现在来看，可能性不大”。

出现这样的情况，一部分原因在于对现实生活数据的“消化”出了问题。因为通过摄取和组织的方式要阅读和理解医学相关的文献，对计算机而言不是件容易事。此外，还有一个更深层次的认识论问题：Jeopardy竞赛的问题都是有正确答案的，但在医学世界里，诊断的结果通常只是信息比较充分的观点罢了，不存在绝对的对错。

不过IBM已经在尝试通过「WatsonPaths」可视化工具将这套认知计算平台变得更透明些，以便让客户了解到它是如何形成某个结论的。甚至 IBM将Watson决策的全部审核路径内嵌于系统中，这样对训练Watson的认知能力，了解其获取数据的方式大有裨益。即使成果并不理想，德州大学医学院教授Lynda Chin也表示，“通过训练和学习，相信Watson有能力实现之前预期的功能”。

毫无疑问，在这场AI竞赛中，Watson在多个领域的可扩展式语料库是IBM的有力武器之一。而5年前的"一站成名"让Watson在业界的名气与日俱增，但如果要实现Watson的大规模商业化，IBM似乎还要更努力一些，毕竟是该兑现承诺的时候了。