最新消息:

OCR软件将密保卡转换实现python脚本查询

Python 大步 1154浏览 0评论

前些天将Limit Login Attempts  换成了BAW More Secure Login,但是问题就是每次登陆都要查看MSL Secure Card 密保卡输入对应的秘钥号码,如下:关键词:  OCR软件 五款BAW More Secure Login

 

每次都要打开藏的很深的图片,然后再在N多的数字中查找,边看边输入到登陆窗口,很麻烦,为什么不弄个脚本,直接根据输入要求的 秘钥代码,自动显示出来,代码实现功能可以分两部分,一个是将密保卡的图片里的 那些秘钥转换成txt文档,这个我感觉是最关键的,也是最棘手的。第二个就简单了多了,python写出查询脚本。

解决第一部分的方法算的上简单。用OCR软件就可以搞定了。这里简单介绍下OCR技术:

OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文 件进行分析处理,获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR(Intelligent Character Recognition)的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易 用性及可行性等。

说是用软件识别出秘钥,转换成文本文档,但是用哪个软件也是个问题,而且软件的识别率很关键的。我找了五款OCR识别软件:

  • 微软 OneNote 2007

  • Office Document Imaging

  • SimpleOCR

  • TopOCR

  • FreeOCR

可是结果却是相当让我不满意识别率太差了,很多字母都识别出错,我自己帮他人工排错,相当于我自己照着密保卡重新输入一遍了,蛋疼的死,打死我也不这么干,最后只好求助于OCR界的老大:ABBYY FineReader 。  虽然软件个头有200多兆,但是OCR的识别效果明显比其他的好上一大截,不过里面还是有个别的字母识别有问题,还要人工纠错下,不过噎死仅有的几个字母,可以用替换的 方法快速纠错。下面是我识别出来的(当然,我把里面的字母和数字给换了,否则就是将自己暴露给不怀好意的人了),本来是想把txt文档贴出来的,但是贴上去后,在notepad++下正常的排版,到wordpress就了,所以最后还是贴出截图

ABBYY FineReader

注意,这个是直接识别出来的排版,我没有做任何的排版工作,这也是识别程度高的体现,很多识别软件不但没识别出字符,而且排版乱的一塌糊涂,人工纠错完全不现实了。

第二步就是写python代码了,实现功能简单,最后发现,用OCR软件识别图片的时间比写脚本代码时间还长些。代码简单,如下:

 

因为xp下已经配置好了python的环境变量,所以直接保存以上代码为key.py,双击运行,测试效果如下,我们找寻  B3

M9({P91EEH`Q(V7)IBT_6~R

测试通过,当然,这个脚本并不完善,我也懒得改了,要知道有个所谓的二八定律,我不打算弄了,其实,完成第一步就已经很方便我们操作了,只要打开txt文档,找到位置复制,就行了,远比脚本代码步骤少些。反正是玩玩,无所谓了。

这篇文章的重点不是脚本,而是OCR软件!!!

关键词:  OCR软件 五款

 

 

转载请注明:大步's Blog » OCR软件将密保卡转换实现python脚本查询

发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

网友最新评论 (1)

  1. 想法不错! sencond or second?
    finler3年前 (2013-10-20)Reply
SiteMap