跟踪技术与自动图像目标识别研究综述
作者:余静, 游志胜 (四川大学图形图像研究所)
摘要: 对复杂背景下扩展目标进行有效的识别和跟踪是一个具有挑战性的难题。对当前的目标自动识别系统( ATR) 所采用的算法进行了归类和叙述, 对目标识别问题中具有旋转、尺度、平移不变性的特征及目标跟踪算法进行了讨论, 最后对自动目标识别和跟踪进一步的研究方向进行了展望。
可以肯定, 信息战将成为未来高技术战争的一种重要作战模式, 对战争的结局起着关键性的作用。目前世界许多国家都积极发展军用高技术及其武器装备, 红外热成像、微光夜视、电视摄像、微波和激光雷达等高新技术得到迅猛发展, 大大促进了信息获取的实时性及其深度和广度, 使现代军队具有昼夜、全天候、大范围监视和捕获目标的能力, 因此, 对目标进行准确、有效的识别和跟踪便成为一项重要的任务[ 1] 。自动目标识别( Automatic Target Recognition, ATR) 技术和稳定的跟踪方法是取得战场控制信息权的关键因素之一。它在民用领域也得到大量的应用, 例如用于身份确认的指纹识别、人脸识别、虹膜识别以及在智能交通管理、机动车检测、停车场管理等场合的车牌识别等。由于目标所处场景的复杂性, 以及目标本身可能发生的姿态变换、缺损、模糊和遮挡, 使得ATR 技术是一个复杂的过程。总的说来, 一个ATR 系统应该具有在复杂背景以及各种天气情况下检测、分类、识别目标的能力[ 2 ~4] , 这样才能有针对性地对目标进行持续的跟踪。
1 ATR 技术的发展状况
由于ATR 技术的重要性, 它已成为国内外信息处理技术发展的重点。近十年来, ATR 已由理论探索、实验室仿真逐渐走向实际应用。目前ATR 技术方法主要有以下五种:
( 1) 经典的统计模式识别方法。该方法主要是利用目标特性的统计分布, 依靠目标识别系统的大量训练和基于模式空间距离度量的特征匹配分类技术, 可在较窄的场景定义域内获得较有效的识别。该方法是早期使用的方法, 仅在很窄的场景定义域内, 且在目标图像和周围背景变化不大的情况下才比较有效, 难以解决姿态变化、目标污损变模糊、目标部分被遮蔽等问题。
( 2) 基于知识的自动目标识别方法。20 世纪70 年代末,人工智能专家系统开始应用到ATR 的研究, 形成了基于知识的ATR, 即知识基( Knowledge Based, KB) 系统。基于知识的ATR 算法在一定程度上克服了经典统计模式识别法的局限性和缺陷, 该方法目前存在的主要问题是可供利用的知识源的辩识和知识的验证很困难, 同时难以在适应新场景中有效地组织知识。
( 3) 基于模型的自动目标识别方法。模型基( ModelBased,MB) 的方法首先是将复杂的目标识别的样本空间模型化, 这些模型提供了一种描述样本空间各种重要变化特性的简便途径。典型的MB 系统抽取一定的目标特性, 并利用这些特性和一些辅助知识来标记目标的模型参数, 从而选择一些初始假设, 实现目标特性的预测。一个MB 系统的最终目标是匹配实际的特性和预测后面的特性, 若标记准确, 匹配过程则会成功和有效。MB 方法目前尚限于实验室研究阶段。
( 4) 基于多传感器信息融合的自动目标识别方法。单一传感器的导引头在有光、电干扰的复杂环境中, 目标搜索和知识识别的能力、抗干扰能力及其工作可靠性都将降低。20 世纪80 年代兴起的基于多传感器信息融合( Multi-sensor InformationFusion Based,MIFB) 的ATR 方法克服了单一传感器系统的缺陷, 每个传感器将数据馈入各自的信号处理机, 先分别进行目标检测, 得出有无目标的判决以及目标的位置信息或运动轨迹, 然后将这些信息送入数据融合单元, 对目标位置或运动轨迹进行关联后再做进一步的判决[ 5] 。
从输入信息的形式来看, 信息融合可在决策层、特征层或像素层等各个层次进行。像素层融合是最低层次的属性融合,即将各个图像传感器数据直接融合, 而后对融合的数据进行特征提取。这一层次的信息融合能够提供其他层次的融合所不具备的细节信息, 采用的融合方法有逻辑滤波器、数学形态学、模拟退火、小波变换等。特征层融合是中间层次的融合, 它是先对各个传感器的观测进行特征提取, 产生特征矢量, 再将这些特征矢量融合, 并作出基于联合特征矢量的属性说明。该层次的融合是像素层融合和决策层融合的折中形式, 兼有二者的优缺点, 具有较大的灵活性, 常用的方法有扩展Kalman 滤波、约束高斯—马尔可夫估计、分片统计等。决策层融合是最高层次的融合, 这种方法是在传感器的观测基础上产生特征矢量,对这些特征矢量进行模式识别处理并作出相应的关于目标的属性说明, 再将各图像传感器的属性说明数据进行关联和合成, 得到该目标的一个联合的属性说明。常用方法有Bayes 推理、D-S 证据推理、模糊逻辑以及近年来涌现的人工神经网络和支撑向量机等。
( 5) 基于人工神经网络和专家系统的自动目标识别方法。专家系统是以逻辑推理为基础, 模拟人类思维的人工智能方法。人工神经网络( ANN) 是以神经元连接结构为基础, 通过模拟人脑结构来模拟人类形象思维的一种非逻辑、非语言的人工智能方法。ANN自底向上的训练和归纳判断特性与专家系统的积累知识的自顶向下的利用特性, 可以实现很好的互相补充结合, 提供更强的处理信息能力。二者混合使用的结构形式有并接结构、串接结构和嵌入结构三种。并接结构系统可并列使用专家系统和神经网络; 在串接结构中, 各模块独立工作, 实现各自特定的功能串联连接; 嵌入结构是在专家系统内嵌入小型神经网络或者在ANN 内嵌入小型专家系统以改善系统性能。ANN技术可以提供ATR 算法固有的直觉学习能力, 在目标分类处理中有许多算法都可由ANN有效地实现。
神经网络应用到模式识别中能解决许多传统的识别方法所不能克服的困难, 文献[ 6] 综合了神经网络、模糊逻辑、模式识别的相关算法对车型进行识别; 文献[ 7] 利用图像特征点和神经网络对有遮挡的目标进行识别, 也获得了较高的识别准确率。神经网络实现工程应用的瓶颈是实时性欠佳。
2、ATR 技术的关键———特征提取
2. 1 特征提取的基本概念
在传统的目标识别算法中通常是提取出目标的轮廓, 然后根据轮廓线的特征对目标进行识别。但在实际操作中, 很难从实景图像中得到目标的实际轮廓, 而且轮廓修复中的误差也会引起目标轮廓的失真而影响目标识别的正确性。因此, 在ATR 系统中, 如何使目标特征化是实现实时、准确目标识别的关键。作为关键步骤, 特征提取的目的是获取一组“少而精”的分类特征, 即获取特征数目少且分类错误概率小的特征向量。特征提取常常分几步进行[ 8] :
( 1) 特征形成。根据被识别的对象产生一组原始特征, 它们可以是传感器的直接测量值, 也可以是将传感器的测量值作某些计算后得到的值。
( 2) 特征选择。由特征形成过程得到的原始特征可能很多, 如果把所有的原始特征都作





