Google人工智能技术新突破：可初步识别视频中的人在做什么运动 ... ...

首页

Google人工智能技术新突破：可初步识别视频中的人在做什么运动 ... ...

文章来源：作者：<a href="http://taovr.com/home.php?mod=space&uid=3">淘乐乐</a> 发布时间：2015年04月09日点击数：次字号：小大

人工智能要想理解真实世界发生的事，可以先从读取视频中的信息开始。Google、Facebook等大公司都在进行图像和语音的分析研究。Google卷积神经网络（Convolutional Neural Networks，CNNs）技术的两位软件工程师在博客上公布了一些研究成果，其中很重要的一个突破是，能够初步辨识出动态视频的内容。

他们认为，由于动态视频增加了时间这个维度，运动轨迹等信息丰富，这方面视频反而比图片更易识别和分类。但是，对视频而言，不仅要分辨出图像中的物体或人，还要搞清楚他们在干什么。如果想要完整地分析一整段视频（如一场足球赛），从建模角度来说是个挑战，因为其中很多参数需要调试，计算量大。

为了解决这些问题，他们会先提取图像中的大致框架，如下图所示，处理这种相对简单的数据可以降低计算的复杂性。为了防止误差过大，他们以光流法（Optical Flow）的形式观察，也就是相对于观察者的运动所造成的观测目标、表面或边缘的运动来判断，如下图所示。

上一篇：Wear VR获150万美元融资游戏下载量超20万[ 04-09 ]

下一篇：微软创意总监谈HoloLens 有自己的优势[ 04-09 ]

所有资讯新闻分类

最新动态行业动态

产品动态厂商动态

技术应用行业案例

论文文献行业词条

3D立体资讯新闻

虚拟现实虚拟仿真

快速成型 3D打印

智能家居智慧城市

民用虚拟现实创客

虚拟现实硬件周边

虚拟现实软件系统

首页

商城

行业

厂商

应用

百科

创客

评测

3D

VR

AI

论坛

首页

热门

Google人工智能技术新突破：可初步识别视频中的人在做什么运动 ... ...