python 验证码识别?

sitereview.bluecoat.com 爬取这个做域名分类的网站时,请求次数较多之后会要求输入验证码,需要查询的数据量在3000+,用什么好的办法解决验证码是别的问题吗? 新手请大神多多指教~~
关注者
35
被浏览
4,366
图像识别
基本就是使用tesseract-ocr。但要做训练。
参看:Setting up a Simple OCR Servermanejandodatos.es/2014/ 以及quora.com/How-do-I-use-

但也可以转换思路,既然每个ip只能访问一定数目,那为何不用多个ip来进行代理来访问呢。另外看看有没有api可用也是一种方法