微软重金收购机器学习公司为哪般?
根据外媒消息,微软收购了以色列一家机器学习厂商Equivio,其拥有的机器学习技术可用于对企业或政府的海量办公文件、电子邮件进行智能分析和归类。
大数据时代,机器学习(Machine Learning)成为一个热门的前沿科技领域。机器学习属于人工智能的一个分支,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习过去被认为是属于研发机构和实验室的深不可测的新技术,但其实离我们并不那么遥远。不信,你且看。
当你使用苹果的Siri,或是谷歌的Google Now,或者是百度语音,甚至是出门问问,来寻找附近的美食餐厅、电影院或者购物广场时,你所使用的工具背后也使用了机器学习技术。
只是,机器学习技术尽管不如人工智能那么宽泛,但其实也是一个大的技术范围,未来可能涉及生活的方方面面。微软收购的Equivio公司,其研发的机器学习技术,可以利用分析软件对大量的非结构性数据和文件进行智能分析,然后进行分组归类。更准确的叫法,划分到更细分的分类,应该属于文本分析技术(也称文本挖掘技术)领域。
根据百度百科的定义,文本数据挖掘(Text Mining)是指从文本数据中抽取有价值的信息和知识的计算机处理技术。顾名思义,文本数据挖掘是从文本中进行数据挖掘(Data Mining)。
更加详细的解释是:
文本挖掘是信息挖掘的一个研究分支,用于基于文本信息的知识发现。文本挖掘利用智能算法,如神经网络、基于案例的推理、可能性推理等,并结合文字处理技术,分析大量的非结构化文本源(如文档、电子表格、客户电子邮件、问题查询、网页等),抽取或标记关键字概念、文字间的关系,并按照内容对文档进行分类,获取有用的知识和信息。
但微软为什么会收购这么一家公司呢,而且还花费了不小的资金,2亿美刀?
时代的发展和用户需求的必然
全世界的企业和政府,每天产生海量的数据,数据规模的增长,已经超过了人类手工处理的能力,传统的搜索、发现相关文件的手段,也已经过时。
巩固自己在办公软件领域的霸主地位
在办公软件领域占据优势的微软,通过收购Equivio,有望将文本挖掘带入到工作人员日常处理的电子邮件和文档中。一方面可以满足用户需求,提升用户体验,另一方面,微软也在通过创新技术保持竞争力,巩固自己在办公软件领域的霸主地位。在Office系列产品中,微软已经有了eDiscovery等信息检索和整理的功能,未来利用Equivio公司的文本挖掘技术,微软将会让这些工具更加智能、更加易于使用。
除了微软, Facebook、谷歌、苹果都已经设立了团队进行研发,机器学习技术的发展,也推动了许多互联网消费者产品的进步。
未来我们很可能在很多领域都使用到文本挖掘技术,甚至是机器学习技术,真正感受科技改变生活。
航空安全领域
数据和文本一样,都可以通过不同的途径、运用多样化的方式进行分析,比如算法式和可视化。通过文本挖掘技术可以帮助各国的航空航天领域的机构能够密切关注流行趋势、事件的增幅减幅以及跑道入侵事故的因素。通过短时间内把所有数据汇集到一起、进行同时分析,能够对诸如航空系统这样的真实系统进行高精确度预测,最终有利于预防和降低事故发生。
金融分析领域
据国外媒体报道,华尔街开始利用程序来读取各类新闻、社论、公司网站信息、Twitter等,分析其中的词汇、语法结果、甚至是表情符号,这些程序会判断解析得到信息对市场的影响,并且自动进行交易。就是典型的用户交易情绪的挖掘和分析,试想要是能早一点判断用户恐慌性抛售股票,那对很多金融企业是何等的重要。
消费场景推荐
亚马逊向消费者推荐商品,或者淘宝天猫京东向你推荐商品时,也将用到文本挖掘技术。而推荐的信息依据其可能是你的评论,也可能是一个提问等等。利用文本挖掘技术,来更好地了解用户的想法,最终实现精准推荐。
实体商场同样也可以用到,通过网络信息获取甚至是线下的客户意见反馈卡的分析,实现更加的消费场景布局,营造体验拉动购物。
未来,企业竞争情报、CRM、搜索引擎、医疗、保险和咨询等等行业都离不开文本挖掘技术。
更多高大上的领域,诸如图像识别、语音识别、机器翻译等领域也会用到文本挖掘。
不过文本挖掘技术,甚至是更宽泛的机器学习技术,人工智能技术,都不会在大众用户中有较高的认知度和知名度,核心原因在于从来没有一个单独的产品叫人工智能,但无论是自动交易机还是谷歌无人驾驶汽车,都是人工智能在应用层面的体现。不管你记不记得,认知不认知,都无法阻挡文本挖掘技术、机器学习技术在你生活的方方面面存在着。