第1章 计算机视觉与神经网络

长期以来,让计算机“能看会听”是计算机科学家一直追求的目标,这个目标中最基础的就是让计算机能够“看见”这个世界,并且能够像人类一样拥有“眼睛”,“看懂”这个世界,进而“理解”这个世界。

研究发现,当一个特定目标出现在人类视野的任意一个范围内时,某些脑部的视觉神经元会一直处于固定的活跃状态。从视觉神经科学的角度解释,就是人类的视觉辨识从视网膜到脑皮层,神经系统从识别细微的特征演变为目标识别。对计算机来说,如果它拥有这样一个“脑皮层”对信号进行转换,那么计算机仿照人类拥有视觉就会变为现实。

随着研究的进一步深入,2006年,Geoffrey Hinton在深层神经网络的训练上取得了突破,首次证明了具有更多隐层和更多神经元的人工神经网络有比较好的学习能力,其基本原理就是首先使用具有一定分布规律的数据保证神经网络模型初始化,再使用标注好的数据在已经初始化的网络上进行计算,最后使用反向传播对神经元进行优化调整。

这里就详细讲解一下神经网络与计算机视觉的关系。