2015人工智能图谱
雷锋网编者按:本文首发公众号“机器之心”,作者马颖君
时至2015,科技界的气氛与往年大不一样:似乎影片《超能陆战队》、《星际迷航》、《机械公敌》中,那些遥远的科技场景都将走进我们的生活。因为,人工智能时代真的来临了。
2015年作为起点,以下生活场景将陆续变成现实:开车时,你说出地点,自动驾驶系统将你带到目的地;在医院,你看到来自美国的拖车机器人Tuggy McFresh在运送医疗器械和来自日本的“大白”机器人Robear在照顾病人;在酒店,2015年新上市的日本Henn-na服务生机器人包揽了从值守前台、运送行李到客房清扫等一众服务;下班后,你按下了“回家模式”,推开家门你发现,窗帘已经拉上,温度适宜,灯光柔和,热水烧好,还有日本软银公司的家居机器人Pepper跟你问好卖萌;在家里,你用iwatch打电话,使用的是可监控和改善睡眠品质的APP;其实,你还可以使用汪峰同款无人飞行器,载着钻戒,向你心爱的她求婚……
这一天,我们等得太久了。
早在第一台计算机埃尼阿克问世后十年,就有科学家预言,人工智能时代将要来临。当“深蓝”赢了卡斯帕罗夫之后,这种美好的情景似乎更是指日可待。但是在整个20世纪后半叶,人工智能研究却因为数次技术革新尝试的失败而停滞,经历了从上世纪50年代到本世纪初期的若干个寒冬期。最近的一个寒冬期,就是20世纪末到21世纪的头10年,也就是深蓝赢得比赛之后,因为神经网络的研究遭遇瓶颈而带来的寒冬。
然而在2014年,科技界和商界的所有人,都能明显的感觉到,人工智能的理论研究和可感知产品似乎突然“喷发”了:各种可穿戴设备扎堆出现,智能机器人频频亮相,机器的人脸识别准确率超过肉眼,Google、苹果和宝马等公司齐发力无人驾驶汽车,美国、欧洲先后设立人类大脑攻关项目……
这次喷发,绝非仅仅是几件讨巧的极客产品的偶然同时出现,而是在经历了寒冬后的2014年,人工智能有了质的突破:一方面,弱人工智能已经有很多成果或者商业化的产品落地,比如语音、人脸识别精准度的大幅提升和即将发售的各种智能家居和机器人;另外一方面,疯狂的科学家、科技巨头和大量的资本也在合谋着更廉价高效的计算和惊世骇俗的产品,以求让计算机像人类一样聪明。过去1年人工智能的高歌猛进,让成功预言机器在1998年战胜人类棋手的美国科学家雷·库兹韦尔(Ray Kurzweil)发出乐观的预言:机器智能超越人类智能总和的那个奇妙“奇点”,就在2045年。
那么,这次人工智能的喷发将会波及到多远?它将在多大程度上改变我们的生活方式?
1、从弱人工智能到强人工智能
“深蓝”在国际象棋领域称霸以后,人工智能没有像预想的那样改天换地,“深蓝”自身则沉寂了十多年,泯然众人。人工智能也在这期间一直停留于弱人工智能的阶段,迟迟不能突破,这段跨度近20年的时间,实际上成为了迄今为止最长的一次AI寒冬。有人戏谈,这20年里面AI领域最最大的成就,就是斯皮尔伯格拍出了《人工智能》这部让全世界年轻人倾倒的科幻电影。
然而,在此期间,虽然科学家们步履缓慢,但人工智能领域的局部发生了巨大变革。在这十多年中,科技明星的角色由各大互联网公司来扮演,PC互联网高速发展,随后移动互联网又异军突起,快速覆盖PC互联网已占有的江山,重构互联网世界。近20年,人工智能跃迁所需要的三个要素逐渐到位。
首先,移动互联网引爆了大数据的井喷,为计算机的深度学习提供了丰富的素材。
正如吴恩达(AndrewNg)所言,数据是人工智能的燃料。比如,以Google为主的广告公司全面撒网,收集各个维度的数据信息。更重要的是,数据种类无所不包,特别是在手机成为了人类的“信息器官”后,人们衣食住行各方面的数据被全方位捕捉,这就为机器拟人化提供了客观条件,用科学家的术语说,大数据帮助他们“突破模型界限”。大数据已经就位,燃料充足。
其次,仅仅有数据还远远不够。要想让机器足够聪明,那么机器还需要更快的计算速度。2005年GPU的出现,极大地提高了运算效率,并促使无人监督学习技术(深度学习涉及技术中的一种)成功。在硬件方面,近20年来主要是通过对大型神经网络来进行仿真,但是这些网络需要大量传统计算机的集群。然而在2014年,IBM发布了一款具有里程碑意义的产品:前所未有的超低能耗、超高集成的芯片TrueNorth。这意味着,也许在不就的将来,庞大的计算机集群将被几枚芯片所替代。因此,有人把 IBM 的芯片称为是计算机史上最伟大的发明之一,认为它将会引发技术革命,颠覆从云计算到超级计算机乃至于智能手机等一切。这似乎预示着,在移动互联时代几乎没有什么作为的IBM,也许会凭着Watson和TrueNorth在人工智能的时代搏得一席之地。
不过,如今计算机的智能程度,早已超越了以计算速度论英雄的时代,现在很多小型计算机的计算水平,都已经打败了当年的“深蓝”,倘若现在再有公司拿出“深蓝”这样的产品来给自己贴人工智能的标签,一定会贻笑大方。
在大数据和计算能力之外,更重要的是:在十多年间,人机交互发生了两次突破。实际上,信息革命降临以来,它每一次商业上波澜壮阔的潮起潮落都是由人机交互方式的变革引起的:PC和鼠标的诞生,dos系统到视窗操作系统的进化,再比如触屏操作和语音交互问世。其中最后两个都是在近十年发生的。特别是语音交互,它意味着计算机拥有了“听觉”并能给出正确的反馈。语音交互的实现解放了人类的双手,促进了人类生产力的巨大飞跃。
大数据的不断丰富,计算速度的日益提高再加上人机交互的重大突破,三个条件都已经具备,弱AI向强AI的进化呼之欲出。
为了更好地理解强AI,我们在此对强AI和弱AI 加以简单区分:让计算机会下棋、能搜索这些事情非常简单,并且已经实现,这些仅需计算速度和数据就可以完成任务都属于弱AI范畴;让计算机听得懂,看得懂,能推理反馈,甚至理解人类感情和文化,这些属于强AI范畴。但是仅仅是想让计算机听得懂、看得懂,便困难重重了,而能够像人类一样,完成对于语言、图片信息的处理加工之后进行反馈,则是由弱AI到强AI突破的关键。那么疯狂科学家是怎么实现这一突破、让计算机拥有类似人类的“听觉”或者“视觉”的呢?我们以计算机识别图片稍加说明。
在解决让计算机拥有识别图片能力的这个问题上,科学家们尝试了不同以往的“训练”计算机的方式——无监督学习。以前,科学家们告诉计算机“猫脸”的几个特征标签,计算机“按标索猫”,但是现在,科学家们改用无监督学习方式,仅下达“去找猫”的指令,让计算机自行确定标签。最后计算机将搜索结果反馈给科学家们。也就是说,人类“授机以渔”,告诉计算机的,只是如何找到标签的方法。“授机以渔”便是无监督学习,它教会计算机为某一目的自行处理大量无标记的数据,进而完成搜索。而计算机今天认识了猫,明天就会认识更多事物。
无监督学习技术的成功标志着深度学习也就此诞生。深度学习被视为是结束AI寒冬的破冰锤,它标志着机器人从弱人工智能到强人工智能进化。如果说大数据是人工智能这架火箭的燃料,那么深度学习能力就是发动机,发动机的动力强大与否将根本上决定人工智能这架火箭是否能顺利升空。2014年无监督学习方面成果斐然:Facebook脸部识别率的精确度达到97.25%,国内科大讯飞AI阵营的汤晓欧领导的计算机视觉研究组,达到的精确度更是高达98.52%。
语义和图片识别技术仅仅是深度学习领域所研究技术的冰山一角。2014年末,Google借递归神经网络(RNN),赋予了计算机更高级别的能力——逻辑推理的能力,让它可以用一句话对画面进行简单描述,这样计算机便具备了用有逻辑的语言描述图片中不同事物的能力。至此,拥有依靠概念为原点进行推理能力的机器人,比只会识别的机器人又迈上了一个更高的台阶。
虽然成绩斐然,但人工智能真正的冰山其实仍然沉在那些实验室里:科学家们最大的企图是让计算机理解人类的情感和文化。计算机科学家DonaldKnuth说过:“人工智能已经在几乎所有需要思考的领域超过了人类,但是在那些人类和其它动物不需要思考就能完成的事情上,还差得很远。”看来,让计算机听得懂,看得懂,会推理判断不足以满足疯狂科学家们的探索欲,他们期待有朝一日计算机能够变得像影片《人工智能》中的大卫一样,拥有可以理解人类情感和文化的能力。这样的强人工智能才是科学家们想要摘得的人工智能研究领域的皇冠。
回顾2014,互联网巨头在向强人工智能进军的路上,各家走的路线有所不同:数据处理速度方面,IBM凭借True North获得了比较高的关注度;Facebook则依托它丰富的人脸图像数据资源,在识别人脸方面取得了超越人脸的高精确度;而对于深度学习方法,Google、Facebook、百度和科大讯飞——这几个拥有了世界上少有的、研究深度学习科学家的公司——一直激烈地争夺着这块人工智能领域的高地。顺带一提,这一次人工智能大潮,可能也是首次中国科技势力和美国科技势力的齐头并进,而不是亦步亦趋。
2、生活中的人工智能
1)了不起的沃森和医用机器人
2011年,Watson在《Jeopardy!》问答节目中完胜对手,随后,这个超级计算机被应用到了医疗等领域。现在沃森不仅能研究蛋白质结构,还能寻找某些药物的替代成分。除此之外,沃森还会自行学习大量文献,通过“假设自动生成”来完成诊断。美国最大的医疗保险公司Wellpoint预测,沃森甚至可以很大程度上帮助缩短辨别癌症的时间。
沃森如此出色,但这并不意味着把一切都交给沃森,人类只需要等待一个结果。就像IBM 在宣传片中所说,“你不是在运行Watson,你是在和它一起工作。Watson 和你都会学得更快”。沃森的意义不在于全权处理各种问题,它的意义在于通过“半人半AI”的方式,帮助人类更好地学习。我们可以预见,参与到“半人半AI”中的Watson能帮助医生、老师和科学家们提高专业水平和科研能力,成为推动不同行业的发展的强大助力。
事实上,沃森并不是第一个被用在医疗领域的机器人,已经有很多“前辈”的身影出现在医院里了。在运送和搞卫生的机器人之外,医院里面还有来自日本Riken和SumitomoRiko公司的“大白”机器人护士Robear,以及来自美国达芬奇公司的协助或者部分代替医生做手术的机器人。早在2013年,InTouch和Bedford公司联合开发的机器人获得了美国FDA的批文,这一里程碑式的事件标志着机器人被正式认可有了给人看病的能力。这款机器人将被用于资源相对匮乏的乡镇医院,来诊断使用者是否中风。它的出现对改善患者转归、减少医护成本起到了很大作用。除此之外,荷兰埃因霍温大学的RoboEarth项目同样值得关注。该项目的四个机器人在模拟医院的环境中相互协作来照顾病人,它们通过与云端服务器的交互来进行信息共享和互相学习,也就是说,一个机器人学会的知识和技能,通过云端分享,瞬间可以“教”会其他机器人,这个技术一旦成熟,一系列智能高效的护理机器人将被迅速复制出来。护理机器人在中国也许将有比较大的市场需求,随着人口红利的逐渐消失和老龄化的进程加快,以后我们很可能面临着病人老人无人照顾的问题,彼时,能代替很多人力的护理机器人就将大有作为了。
2014年末,IBM参与到“登月计划”中,该项目通过沃森来整合临床医生和研究人员的知识,采用IBM沃森技术来消除癌症,同时越来越多的成熟的机器人也将能够走进医院,提供给医生和病人更好的帮助和更优质的护理。近日,IBM斥资10亿美元成立沃森部门,并集中精力帮助外围开发者以及其他公司为Watson开发应用。一向高冷的IBM开始变得开放,我们可以预见,沃森将给各行各业带来不可思议的变化。
2)可预期的自动驾驶汽车
2014年智能汽车方面热度非比寻常,互联网公司或忙着和汽车公司联姻,或迅速收购、入股地图导航公司,或积极推出车联网解决方案。各大公司争先恐后抢滩智能汽车,我们产生了这样的错觉:看他们这样热情,智能汽车似乎呼之欲出了吧?
然而智能汽车的实现至少需要以下几个条件:稳定可靠的车联网平台,高精度的地图,操作流畅的汽车“第四块屏幕”,各部件性能、状态数据的及时反馈,嘈杂环境中高精度的车载语音识别系统。当这些条件完全具备时,才能实现人工智能在汽车操控中的应用。而这种应用恐怕也是以人机交互来为主要表现形式的,也就是说,让汽车能听懂理解人的指令,并能给出正确的反馈。不过春节期间网络上风传的山东大汉对着“安吉星”怒吼,反应出来在使汽车实现人工智能的之前,首先还需跨越人机交互这个重要的槛儿。如何能实现人和汽车良好的交互,是研究智能汽车中的一个重要课题。据科大讯飞董事长刘庆峰透露,科大讯飞和宝马等豪车品牌以及国内的汽车厂商,已经通过严格测试达成关于智能语音操控技术的合作并且今年会有产品上市,如果真是这样,那么汽车朝智能化算是迈进了一大步。
然而,在“让汽车变得更智能”的众多课题中,人机交互是比较基础的一个。2015年,Google自动驾驶汽车延续着我们的期待,但是,说让自动驾驶汽车真正上路,恐怕还有很长的一段路要走。
3)智能可穿戴设备和智能家居
可穿戴设备的概念在近两年越炒越热,但是雷声大雨点小的GoogleGlass 已经停产,定位在消息通知中心的Moto+360也略显小众,中国市场涌现的各种可穿戴设备在一哄而上之后,难有几款被记住名字。目前,市场上仍是缺少一款获得巨大成功的产品,苹果会不会打破这一僵局呢?对于苹果,用户期待更多,希望它不仅能查看信息,还能够实现更多的交互和功能。刚刚发布的AppleWatch不负众望,它搭载了很多新花样,包括健康监测、无卡支付、涂鸦信息传递和腕部触摸。然而AppleWatch是否能被广大消费者认可,还有待市场的验证。
2014、2015年CES上展出的智能家居着实让人眼界和脑洞同时大开:智能烤炉,帮你减肥的冰箱,能显示新闻的桌子……这些展品让梦想照进现实,文章开篇描述的生活着实指日可待了。
那么各大巨头在推动这样的生活成为现实的进程中,分别有着什么举动呢?财大气粗的Google,一年内豪掷数十亿美元完成了对于Nest Labs等家智能家居公司的一系列收购。紧接着推出开发者计划,发布API,走开源路线,打造智能家居平台。相比之下苹果逊色很多,它也试图打造HomeKit智能家居平台,似乎欲以“苹果”这个金字招牌吸引众多家电公司众流归海,然而一个产品都没发布的苹果似乎难以和心态更开放的Google抗衡。在国内智能家居领域,各路公司也一哄而上:海尔打造U+智慧生活开放平台,随后Smartcare产品落地;小米高调联手美的,在家居领域再深跨一步……然而,目前摆在众企业面前的问题是:如何让非刚需的智能家居真正的走入市场,被消费者认可?品牌先行也许会成为智能家居打破“极客专属”这样尴尬局面的一个方法。谁将会是智能家居这片蓝海中,第一个强大的品牌塑造者呢?
3、人工智能的未来
随着计算速度的越来越快,数据越来越丰富,新的算法不断被开发,人工智能的未来让人充满了想象。
人工智能思想家NickBostrom描述了三种超人工智能可能的工作模式:能够准确回答几乎所有困难问题的先知模式,能够执行任何高级指令的精灵模式和能执行开放式任务、拥有自由意志和自由活动能力的独立意识模式。
Nick Bostrom在TED演讲
第一种模式已经大部分实现,第二种模式正在通过深度学习不断逼近。至于第三种,自从1920年科幻舞台剧《罗素的万能工人》上演之后就一直没有停止过对“拥有独立意识机器人是否会毁灭人类”的争论。老生常谈的最近一场争论是以盖茨、霍金和穆斯克为代表的悲观阵营认为人工智能有潜在的危险,甚至可能毁灭人类。这场争论与之前的略显不同,因为人们没有料到三个科技界巨头,本应是“疯狂科学家”的人,竟然站在了悲观者的立场上。
不过,反讽的是,连声音都很难发出的霍金,正是靠着人工智能设备才能向世界表达出这一观点。看来还是哲学家们说得对:机器越趋近于人,人类就会越惊慌失措。
“你希望机器人拥有人格吗”——必须承认,这其实是一个严肃的问题。因为人类是极为聪慧的,而和智商配套的是人类与生俱来必须面对的那些悖论以及道德选择,这些悖论和道德选择让人类的聪慧不至于毁灭地球。机器人很聪慧以后,是否也会配套地产生相应的悖论和道德意识呢?既然有了自我意识,那么机器人还会遵守阿西莫夫著名的“三大法则”吗?
没有人知道答案。目前我们也只能从《2001太空漫游》、《人工智能》和《超能查派》这些隶属于三个不同人工智能时代的代表电影中获得些启发。
回到现实。从目前科技的发展水平来看,出现像《三体》中智子那样的集各项特工素质为一身、可能毁灭人类的机器人,着实还有一段漫长的路要走。既然连更危险的克隆技术都没捅出什么大篓子,那么在机器人毁灭人类之前,我们还是让人工智能先解决人类的一些燃眉之急吧!
我们现在就预见的美丽新世界是:在不久的将来,机器人能理解我们的语言、懂得我们的情感,能让我们的生活质量提高;我们更期待机器人可以代替人类做一些危险工作,希望沃森能够尽早帮助医生找到治疗癌症的有效方法。
在2015年,这些美丽的愿景中,有的已经可以实现。