- 计算机视觉与深度学习实战:以MATLAB、Python为工具
- 刘衍琦 詹福宇 王德建
- 543字
- 2020-08-27 18:18:33
第9章 基于特征匹配的英文印刷字符识别
9.1 案例背景
在日常学习和生活中,人眼是人们接收信息最常用的通道之一。据统计,人们日常处理的信息有75%~85%属于视觉信息范畴,文字信息则占据着重要的位置,几乎涵盖了人类生活的方方面面。如对各种报纸期刊的阅读、查找、批注;对各种文档报表的填写、修订;对各种快递文件的分拣、传送、签收等。因此,为了实现文字信息解析过程的智能化、自动化,就需要借助计算机图像处理来对这些文字信息进行识别。
早在20世纪50年代初期,欧美就开始对文字识别技术进行研究。特别是1955年印刷体数字OCR产品的出现,推动了英文和数字识别技术的发展。美国IBM公司的Casey和Nagy最早开始了对汉字识别的研究,并于1966年发表了第一篇关于汉字识别的论文,采用模板匹配法识别1000个印刷体汉字,从此在世界范围内拉开了汉字识别研究的序幕。日本于20世纪70年代中期开始进行手写体汉字识别的研究,我国于20世纪80年代初期开始进行手写体汉字识别的研究。
本案例重点研究印刷体图像的灰度转换、中值滤波、二值化处理、形态学滤波、图像与字符分割等算法,形成一套效果明显、简便易行的印刷体字符图像识别算法。在印刷体字符的识别过程中,采用字符的归一化和细化处理方法,通过二值化和字体类型特征相结合的处理方式完成特征提取,并建立字符标准特征库,运用合理的模板匹配算法实现对印刷体字符的识别。