当前位置:嗨网首页>书籍在线阅读

01-验证码处理

  
选择背景色: 黄橙 洋红 淡粉 水蓝 草绿 白色 选择字体: 宋体 黑体 微软雅黑 楷体 选择字体大小: 恢复默认

[toc]

第7章 验证码处理

验证码(CAPTCHA)的全称为全自动区分计算机和人类的公开图灵测试(Completely Automated Public Turing test to tell Computersand Humans Apart) 。从其全称可以看出,验证码用于测试用户是否为真实人类。一个典型的验证码由扭曲的文本组成,此时计算机程序难以解析,但人类仍然可以(希望如此)阅读。

许多网站使用验证码来防御与其网站交互的机器人程序。比如许多银行网站强制每次登录时都需要输入验证码,这就令人十分痛苦。本章将介绍如何自动化处理验证码问题,首先使用 光学字符识别(Optical Character Recognition,OCR) ,然后使用一个验证码处理API。

在本章中,我们将会介绍如下主题。

  • 验证码处理;
  • 使用验证码处理服务;
  • 机器学习和验证码;
  • 报告错误。