论文部分内容阅读
笔者利用OCR算法引擎Tesseract的样本训练方法,对简单验证码和复杂验证码进行识别。使用预处理后的单字符图片作为训练样本,对算法进行样本训练,以提高算法对普通字符验证码的识别率,并且使其可以识别较为复杂的字符验证码。实验结果证明,样本训练后的算法对简单验证码的识别率达到了99%以上,且可以对原本几乎无法识别的复杂验证码进行有效识别。