Большинство популярных сайтов и веб-сервисов используют защиту от ботов — капчу. Она представляет собой тест для распознавания пользователей и отсечения ботов. Капча помогает бороться со спамом и интернет-мошенничеством, но, к сожалению, она же может стать проблемой для многих людей, работающих в интернете. Так, капча может снижать скорость парсинга с сайтов и поисковых систем в несколько раз.
Первоначальная версия защиты от ботов называлась "Captcha", но с последующей покупкой технологии компанией Гугл система получила название “ReCAPTCHA” и несколько обновленных версий: В1, В2, В3 и Корпоративная. В сравнении с первой версией, которая предлагала напечатать изображенный текст, последующие версии стали хитрее. Теперь обновленная система анализируют уникальные отпечатки пользователя и его поведение при распознавании капчи. Например, может учитываться тип устройства, версия ОС, ip-адрес, авторизация в сервисах Гугл и даже предыдущая активность пользователя.
В новых версиях скрипт ReCAPTCHA при решении теста генерирует оценку пользователя на основе анализируемых данных: от 0.0(Бот) до 1.0(Человек). При создании оценки используется адаптивный анализ рисков, который включает в себя не только уникальные идентификаторы, но и, как говорили ранее, поведение пользователя. Далее в зависимости от оценки пользователь может пройти дальше либо уйти на дополнительную проверку.
Например, при прохождении капчи с личного телефона с авторизованными сервисами Гугл оценка пользователя составит 0.9 балла. А при прохождении теста на браузере компьютера без авторизации в Gmail и с публичным адресом оценка может упасть до 0.3. Низкая оценка, вероятнее всего, повлечет к повторному прохождению и увеличению частоты появления теста при работе с другими страницами сайта, что может сильно усложнить работу. Поэтому для обхода ReCAPTCHA нужно серьезно отнестись к подмене отпечатков.
При нечастом отправлении запросов для решения капчи можно не беспокоиться о санкциях со стороны системы, но когда требуется решить большое количество капчи, без изменения ip-адреса не обойтись. Например, при массовой рассылке по почте или при парсинге ключей с поисковых систем.
Так, при отправлении множества запросов с одного ip-адреса РеКапча может увеличить количество отображаемых рисунков или частоту их появления. Также система может заблокировать устройство – в этом случае доступ к ресурсу будет закрыт или капча станет постоянно перезагружаться, не позволяя попасть на страницу даже в случаях с успешным решением теста. Избежать этого можно, изменив ip-адрес с помощью прокси-сервера. Он поможет скрыть реальный ip, снизив подозрительную активность в глазах защиты Гугла.
Лучшим выбором для решения капчи являются Динамические IPv6 со сменой IP после каждого запроса. При подключении таких прокси каждый запрос к ReCAPTCHA будет происходить с нового IP.
Не рекомендуется использовать бесплатные прокси. Как уже писали ранее, их IP занесены в “Спам списки” и чаще всего находятся в ЧС сервисов Гугл и других. При использовании бесплатных прокси-серверов капча появляется с большой частотой, что может привести к большим затратам при использовании платных сервисов для решения РеКапчи.