推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
sniperhgy
V2EX  ›  Python

用 Python 写爬虫,请各位坛友推荐一个免费好用的验证码识别方法或者平台

  •  
  •   sniperhgy · Oct 25, 2017 · 6334 views
    This topic created in 3132 days ago, the information mentioned may be changed or developed.

    如题,遇到有验证码的网站,就完全爬不起来了,请大家指点一下,谢谢了。

    15 replies    2017-11-03 11:14:14 +08:00
    TKKONE
        1
    TKKONE  
    PRO
       Oct 25, 2017
    接入打码平台
    comeluder
        2
    comeluder  
       Oct 25, 2017
    打码兔~~
    hcnhcn012
        3
    hcnhcn012  
       Oct 25, 2017   ❤️ 1
    gaojin
        4
    gaojin  
       Oct 25, 2017
    如果自己玩的话 ,那就把图片下载下来,手动输入,
    大规模的话,可以机器学习识别 或者 接入第三方打码平台。
    tcsky
        5
    tcsky  
       Oct 25, 2017
    除了手动, 其他都是付费的
    toono
        6
    toono  
       Oct 25, 2017
    安装 tesseract,然后 Python 调用。

    觉得不准确的话,自己写配置去训练。
    zhangsen1992
        7
    zhangsen1992  
       Oct 25, 2017
    机器学习?自己训练?
    zbl430
        8
    zbl430  
       Oct 25, 2017
    什么样子的验证码,发来瞧瞧
    ppwangs
        9
    ppwangs  
       Oct 25, 2017
    只是登录的话,保存 cookie 定时刷新。

    我最近正好做相关的东西,识别验证码真复杂。
    Sanko
        10
    Sanko  
       Oct 25, 2017 via Android
    目前在用阿里云的英数
    qq316107934
        11
    qq316107934  
       Oct 25, 2017 via Android
    把验证码发出来看看,不一定要用打码平台
    JayFang1993
        12
    JayFang1993  
       Oct 26, 2017


    就微博这种怎么处理?
    sniperhgy
        13
    sniperhgy  
    OP
       Oct 26, 2017
    谢谢各位的回应,暂时用了 tesseract,但是识别度有点低,验证码只要稍微一变点花样,就不能正确识别了
    TKKONE
        14
    TKKONE  
    PRO
       Oct 26, 2017
    @sniperhgy #13 明明可以花几元钱就可以打一两千次的码,偏偏选择成本更高的机器识别
    qsnow6
        15
    qsnow6  
       Nov 3, 2017
    @Sanko 英数是啥,没搜到
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2959 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 88ms · UTC 09:14 · PVG 17:14 · LAX 02:14 · JFK 05:14
    ♥ Do have faith in what you're doing.