极验中文验证码需要用户按照指定的汉字顺序依次点击验证图片中嵌入的中文字符
本项目基于深度学习目标检测技术进行验证码识别,实现点选中文验证码破解
windows10 python tensorflow
采用Faster RCNN 深度学习定位技术,技术框架使用了dBeker的window版Faster RCNN开源项目:超连接
采用中文识别常用的5层CNN神经网络,识别4K个汉字分类
对验证码图像进行图像分割,分割为校验区和主区,校验区图像采用文字扫描算法识别文字位置,主区图像采用文字定位技术识别文字位置 对成功识别位置的文字进行灰度,中心二值化采样,作为文字识别神经网络输入
文字定位网络训练样本
对极验中文验证码直接进行位置标注,分类大小1
文字识别网络训练样本
来源1:对极验中文验证码直接进行分类标注,分类大小4000 来源2:从中文字体库中直接生成字体,分类大小4000
训练样本通过旋转,加噪,腐蚀膨胀等方式进行样本扩充 并存储为tfrecord格式
*文字定位训练 1.图像分割,使用主区图像进行定位训练
*文字识别训练 1.采用字库生成字体,作为输入样本进行预训练 2.验证码字体,进行二轮纠正训练
主区和校验区字体,分别进行训练
该项目仅用于学术交流,不得任何商业使用!