展会信息港展会大全

无处不在的OCR(光学字符识别)
来源:互联网   发布日期:2011-08-30 20:24:01   浏览:17033次  

导读:OCR(Optical Character Recognition,光学字符识别),是属于图型识别的一门学问。其目的就是要让计算机知道它到底看到了什么,尤其是文字资料。本文为您详细介...

OCR(Optical Character Recognition,光学字符识别),是属于图型识别的一门学问。其目的就是要让计算机知道它到底看到了什么,尤其是文字资料。本文为您详细介绍OCR技术的发展、应用。

也许提到“OCR”,许多人都会觉得非常陌生,其实OCR是光学字符识别技术(Optical Character Recognition)简称,它是针对印刷体字符,采用光学的方式将文档资料转换成为原始资料黑白点阵的图像文件,然后通过识别软件将图像中的文字转换成文本格式,以便文字处理软件进一步编辑加工的系统技术。

看了这个概念,你可能会认为,这么深奥的一个技术和我肯定没有多大关系。不过你错了,就在你的身边,OCR技术的应用无处不在,而OCR也在时刻改变着你的生活……

OCR技术由来已久

1929年,德国的科学家Tausheck首先提出了OCR的概念,并且申请了专利。几年后,美国科学家Handel也提出了利用技术对文字进行识别的想法。但这种梦想直到计算机的诞生才变成了现实。 OCR的意思就演变成为利用光学技术对文字和字符进行扫描识别,转化成计算机内码。

在60~70年代,世界各国相继开始了OCR的研究,而研究的初期,多以文字的识别方法研究为主,且识别的文字仅为0至9的数字。以同样拥有方块文字的日本为例,1960年左右开始研究OCR的基本识别理论,初期以数字为对象,直至1965至1970年之间开始有一些简单的产品,如印刷文字的邮政编码识别系统,识别邮件上的邮政编码,帮助邮局作区域分信的作业;也因此至今邮政编码一直是各国所倡导的地址书写方式。

汉字OCR技术发展迅速

对于汉字的识别最早可以追溯到60年代。1966年,IBM公司的Casey和Nagy发表了第一篇关于印刷体汉字识别的论文,在这篇论文中他们利用简单的模板匹配法识别了1,000个印刷体汉字。

70年代以来,日本学者做了许多工作,其中有代表性的系统有1977年东芝综合研究所研制的可以识别2000汉字的单体印刷汉字识别系统;80年代初期,日本武藏野电气研究所研制的可以识别2300个多体汉字的印刷体汉字识别系统,代表了当时汉字识别的最高水平。

此外,日本的三洋、松下、理光和富士等公司也有其研制的印刷汉字识别系统。这些系统在方法上,大都采用基于K-L数字变换的匹配方案,使用了大量专用硬件,其设备有的相当于小型机甚至大型机,价格极其昂贵,没有得到广泛应用。

我国OCR技术自70年代才开始对数字、英文字母及符号的识别进行研究。

同国外相比,我国的光学字符识别研究起步较晚。但由于我国政府对汉字自动识别输入的研究从80年代开始给予了充分的重视和支持,经过科研人员十多年的辛勤努力,汉字识别技术的发展和应用,有了长足进步:从简单的单体识别发展到多种字体混排的多体识别,从中文印刷材料的识别发展到中英混排印刷材料的双语识别。各个系统可以支持简、繁体汉字的识别,解决了多体多字号混排文本的识别问题,对于简单的版面可以进行有效的定量分析,同时汉字识别率已达到了98%以上。

OCR的“三级跳”

任何一项技术要从实验室走向市场,都要实现技术、产品和应用的“三级跳”。对于OCR技术来说也是如此。正如上面所说的,OCR在中国经历了几十年的发展,技术和产品已经非常成熟了,其识别率也已经达到相当高的水平,而在应用方面,却远远落后于欧美以及日本等国家。因此,实现OCR从技术、产品顺利“跳入”应用领域就成为了许多有识之士的奋斗目标。

从行业消费者的需求来看,电子政务、金融、保险、税务、工商等行业用户对信息识别的需求已越来越广泛,由此大力促使了识别技术的大规模的应用。而个人消费者对资料电子化、手写识别技术等需求拓展了OCR识别技术在这一领域的应用之路。与此同时,网络时代的特征也在影响着OCR应用市场的前进步伐,政府、公司、家庭、个人均是网络时代的组成部分,个人资料电子化、商务办公自动化等需求的呼声越来越高涨,从这个角度来看,OCR应用市场的崛起颇有“时世造英雄”的意味。

在成熟的技术应用和市场的需求下,以成熟完备的技术积累为基础,信息识别领域的应用导向将OCR市场送上了更高的一级台阶。

无处不在的OCR

当前,OCR已经逐步进入了人们日常学习、生活、工作等各个应用领域。我们知道银行的客户存单一般都是进行图像存档,以前的存档方法是通过微拍的方式,非常耗时、耗力。现在通过OCR技术,就可以在通过扫描仪对存单进行扫描,通过OCR技术对存单的关键字段进行识别,然后进行索引、存入光盘,极大地方便了查找。

从上面应用中我们不难发现,只要涉及表格、文字方面的信息处理,OCR就会很好的发挥优势。因此,保险公司的保单,超市的进货单,增值税发票、甚至人大代表的选票也都可以用OCR进行识别,而且识别率相当高。

看来,OCR技术无时无刻不在影响这人们的生活,那么作为一个已经发展了几十年的“老技术”,如何能“永保青春”呢?与目前OCR应用市场的发展空间相比,面对崭新的市场应用和变化以及消费者的需求,市场还有许多潜力等待厂商去挖掘?对于OCR产品厂商来说,这既是机遇也是挑战。不过可以肯定的是,信息化事业的未来就是OCR应用市场的未来。我们有理由相信,中国的OCR市场将进入全面应用的春天!

赞助本站

人工智能实验室

相关热词: OCR 光学字符识别

AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港