第1章 绪论

视觉是人类智能的重要组成部分,人类获取的信息70%~80%来自视觉。计算机视觉是信息科学领域具有挑战性的重要分支之一,其中心任务是通过对单幅或多幅二维图像进行分析计算来获得图像的内容信息。众所周知,计算机不认识图像,只认识数字。为了使计算机能够“理解”图像,从而具有类似于人的“视觉”,人们需要从图像中提取有用的数据或信息,得到图像的“非图像”表示或描述,如数值、符号或向量等。这一过程就是特征检测,而检测出的这些“非图像”的表示或描述就称之为特征。图像特征检测是计算机视觉中的重要问题和关键技术之一,也是各种视觉任务的基础环节,其目的是从图像中提取稳定、可靠的特征。图像特征检测在如下诸多领域有着极其重要的应用[1-2]

(1)物体识别 物体识别是计算机视觉的基本内容和应用之一,其主要任务是将单一物体的目标图像与图像集合中的图像进行比较,找到与目标图像内容一致的图像,从而达到识别出目标的目的。该过程需要利用特征检测技术来提取图像中目标的信息。

(2)视频跟踪 视频跟踪是计算机视觉的重要应用,其主要目的在于进行视觉监控或者通过自动跟踪目标的运动轨迹分析目标的行为。近几年来,随着匹配技术的发展,进行特征检测并在不同视频帧之间进行特征匹配已成为视频跟踪的主流方式之一。

(3)遥感图像配准 随着新型遥感传感器的不断投入使用,多种航空和卫星遥感平台每天都会获得大量图像数据,利用计算机对这些遥感图像进行自动分析已成为世界各国的迫切需求。典型的应用有信息融合和变化检测,前者将不同传感平台的图像进行集成分析,利用这些互补信息获得准确的地球资料,来实现诸如分类、测量和识别等高层任务;后者对同一地区不同时刻获取的图像进行分析比较,来监控和检测目标场景的变化。在遥感图像处理中,无论是目标识别、变化检测还是几何配准等环节均需要首先检测图像中点、线和区域等特征。

(4)三维重建 三维重建的任务是通过两幅或多幅不同视角下拍摄的图像来恢复场景的三维几何结构,其主要步骤由图像获取、特征检测、特征匹配、三维坐标恢复和三维显示等组成。显然,特征检测与定位是恢复图像三维结构信息的前提条件,特征检测的准确性将直接影响到三维重建的效果和精度。

(5)图像检索 随着计算机技术、网络技术和数字图像设备的发展与普及,全世界的数字图像的容量正以惊人的速度增长,如何有效地对大规模图像数据库进行管理并快速检索出所需图像是目前一个相当重要又富有挑战性的研究课题。基于内容的图像检索技术正是为了解决这一问题应运而生的,并在近年来受到越来越多的关注,其在许多领域具有广泛的应用前景。本质上说,基于图像内容的检索就是获取请求图像特征、查找与请求图像特征近似的图像的过程。

此外,特征检测自动工件检测、视频数据压缩、合成高分辨率图像、基于图像的建模和绘制、模式分类、图像拼接以及增强现实等应用中也具有重要的应用前景。可以说,特征检测是诸多计算机视觉应用和图像处理的共性核心问题。

图像特征主要包括点特征、线特征和区域特征,其历史可追溯到20世纪70年代,Moravec[3]基于自相关函数提出了最早的角点检测算子,至2004年Lowe做出了里程碑式的成果,提出了高效的尺度不变特征变换(Scale Invariant Feature Transform, SIFT)[4]。历经30多年的发展,图像特征已经发展得较为成熟。但由于图像成像机理条件多变和几何形变的复杂多样,不同应用对图像特征检测的具体要求也各不相同,还有许多问题需要进一步深入研究,如光照条件比较差情况下的特征检测、大视角变换时稳定特征的检测等。总之,图像特征的检测目前依旧是一个具有重大意义而又有挑战性的课题,本书正是在这种背景下对图像特征检测问题展开研究,主要研究图像中点、线、区域、规则图形(如多边形、圆和椭圆)等各种特征的鲁棒性及高精度提取,以及特征检测技术在图像对称性检测、新闻字幕提取和珠宝尺寸自动测量方面的应用。下面分别从特征点、特征线和特征区域三方面介绍特征检测方面的研究发展。