vlambda博客
学习文章列表

通用验证码识别SDK免费开源

大家好,我是TJ

关注TJ君,回复“武功秘籍”免费获取计算机宝典书籍

小伙伴们平时登录各种网站看着各种各样的验证码,是不是会好奇到底是怎么实现的呢?

实际上呢里面用到了很多OCR识别的概念,TJ君之前看到一个不错的项目,浅显易懂,那么今天TJ君就要和大家来分享这个Python通用验证码识别模块,SDK免费开源版,带带弟弟,也称ddddocr

非常有趣的名字,目前呢ddddocr已经更新到了1.4.3版本。

ddddocr是由sml2h3开发的专为验证码厂商进行对自家新版本验证码难易强度进行验证的一个python库,其通过大批量生成随机数据后进行深度网络训练,本身并非针对任何一家验证码厂商而制作。

ddddocr奉行着开箱即用、最简依赖的理念,尽量减少用户的配置和使用成本,争取让每一个小伙伴都用的舒适。

从1.2.0版本开始,ddddocr的识别部分进行了一次beta更新,主要更新在于网络结构主体的升级,其训练数据并没有发生过多的改变,所以理论上在识别结果上,原先可能识别效果的很好的图形在1.2.0上有一小部分概率会有一定程度的下降,也有可能原本识别不好的图形在1.2.0之后效果却变得特别好。不过OCR识别嘛,TJ君一直觉得有点玄学的影子在里面。

通用验证码识别SDK免费开源

然后在1.3.0版本中,ddddocr增加了目标检测部分, 目标检测部分同样也是由大量随机合成数据训练而成,对于现在已有的点选验证码图片或者未知的验证码图片都有可能具备一定的识别能力,适用于文字点选和图标点选。简单来说,对于点选类的验证码,可以快速的检测出图片上的文字或者图标。

通用验证码识别SDK免费开源

等到了1.4.0版本,又新增了两种滑块识别算法,算法非深度神经网络实现,仅使用opencv和PIL完成。实现了拖来拽一些图片模块的实现。

然后就是目前最新的1.4.3版本,这个版本升级的主要原因是为了dddd_trainer 的开源进行适配,使dddd_trainer 训练出的模型可以直接无缝导入到ddddocr里面来使用。

对验证码感兴趣的小伙伴,不妨来试一试哦:

关注我,每天了解一个牛x、好用、有趣的东东

往期推荐