高大上的深度学习,在智能手机上就可实现了
深度学习在声频、图像、视频处理上已经取得了令人印象深刻的进步,但是它通常需要功能强大的电脑才可以进行,如果如果它出现在我们的手机上呢?
那些大致模仿人脑工作的软件赋予了智能手机新的智慧,更精确和更复杂的APP也应运而生,它们能追踪人类的行为和情绪。这些软件利用了一种被称为深度学习的人工智能技术,它模拟神经元和突触来进行数据处理。给予程序一些视觉刺激,还可以加强某些虚拟神经元之间的联系,使它能够识别人脸图像或者其他该程序未见过的图像。
深度学习技术在处理图像和音频方面已经有令人瞩目的进步:
去年,Facebook的研究人员用它建立了一个系统,可以用来确定两张不同的照片显示的是否是同一个人;
谷歌采用这种方法创建了一款可以用短句子描述复杂图像的软件。
然而,到目前为止,大部分功能只能在强大的电脑上进行过尝试。智能手机通过远程服务器,也可以利用深度学习技术,但这样可能会很慢,而且只有在设备处于良好的网络连接环境下才行。
让尝试学习走进寻常手机
现在贝尔实验室的首席科学家Nic Lane提出,部分智能手机的功能强大到可以运行某些深度学习技术,并且他还认为,深度学习可以改善手机APP 的性能,例如过滤掉麦克风里的杂音,或删除加速计采集的数据中不必要的信号。
当Lane去年还是微软亚洲研究院的首席研究员时,他和一名剑桥大学的研究生Petko Georgiev,建立了一个相对简单的深度学习项目模型,可在一款改进后的智能手机上运行。
研究者们试图找出这款模型是否可以提高智能手机的检测能力:
从手腕上的加速计采集数据,分析某人是否做了譬如喝汤或者刷牙这样特定的动作;
是否可以从通话录音中,用手机来确定使用者的情绪或身份。
在本月的墨西哥圣达菲HotMobile会议上,他们在一篇报告里详细介绍了他们的研究结果。他们表示这款软件在识别人类行为上,比别的软件的精确率高出10%,其神经网络能够和其他方法一样准确识别说话者身份和说话者的情绪。
他们创建的神经网络模型相比于Facebook的成果,仍算不上多厉害,但它可以更快更靠谱地完成某些任务。Lane说:
“我们想将智能灌输到一切设备,让它们理解世界并作出反应。”
也许用上了他们软件的手机,才是真正的智能手机吧。
via tr