机械视觉之OCR文字识别时间先容

  • A+
所属分类:机器视觉
,中文叫做光学字符识别。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。 OCR字符识别技术广泛应用于银行票
机械视觉之OCR文字识别时间先容

机械视觉之OCR文字识别时间先容

  ,中文叫做光学字符识别。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。

  OCR字符识别技术广泛应用于银行票据、文献资料录入和处理领域。适合于银行、税务等行业大量票据表格的自动扫描识别及长期存储。在机器视觉领域,OCR同样具有多方面的应用,通过工业相机、工业镜头拍摄文字图像,运用机器视觉软件进行相应处理以获取我们需要的信息,常见的应用有:

机械视觉之OCR文字识别时间先容

  对印刷表面字符的漏印、对错、缺陷、有无、偏移度等进行识别检测,判定被检产品是否合格,并输出检测结果和相应信号。

  文字识别一些目前的应用已经是比较成熟了:比如汉王OCR,百度OCR,阿里OCR等等。其实我们自己也能感受到,OCR技术确实也在改变着我们的生活:比如一个手机APP就能帮忙扫描名片、身份证,并识别出里面的信息;汽车进入停车场、收费站都不需要人工登记了,都是用车牌识别技术;我们看书时看到不懂的题,拿个手机一扫,APP就能在网上帮你找到这题的答案。这都是于基于OCR技术的应用。

  在一些简单环境下OCR的准确度已经比较高了(比如电子文档),但是在一些复杂环境下的字符识别,在当今还没有人敢说自己能做的很好。现在大家都很少会把目光还放在如何对电子文档的文字识别该怎么进一步提高准确率了,因为他们把目光放在更有挑战性的领域。OCR传统方法在应对复杂图文场景的文字识别显得力不从心,越来越多人把精力都放在研究如何把文字在复杂场景读出来,并且读得准确作为研究课题,用学界术语来说,就是场景文本识别(文字检测+文字识别)。

机械视觉之OCR文字识别时间先容

  从上图可以看出,自然场景下的文字识别比简单场景的文字识别实在困难太多了,现在虽然出了很多成果,但是离理想结果还是差很远。