Бесплатно Экспресс-аудит сайта:

28.12.2023

Искусственный интеллект может заменить клик-фермы в обходе Captcha

Исследователь решил выяснить , смогут ли возможности искусственного интеллекта заменить стандартные клик-фермы для решения Captcha . Напомнив о выпуске Google reCaptcha v2 в 2014 году, ставшей наиболее популярным решением для проверки подлинности пользователей, автор подчеркивает актуальность этой проблематики. Captcha помогают предотвратить создание множества фейковых аккаунтов хакерами для незаконного продвижения товаров или влияния на выборы. Обычно злоумышленники используют услуги клик-ферм, где люди решают тесты Captcha за определённую плату — в среднем $3 за 1000 тестов.

Традиционно тест Captcha разбивает изображение на квадраты 4х4 и пользователю нужно выбрать те, которые содержат определенный объект. Один из подходов к решению такой капчи — использовать модель классификации изображений и запустить её 16 раз на каждом квадрате. Однако это может не сработать, поскольку изображение может пересекать несколько квадратов, и идентифицировать его часть будет сложно.

Первый подход исследователя заключался в обучении собственной модели ИИ на основе изображений, найденных через библиотеку Python duckduckgo-search, по ключевым словам, связанным с дорожным движением и светофорами. Несмотря на значительные усилия, удалось собрать всего около 30 подходящих изображений, и модель не показала высокой эффективности из-за ограниченного объёма данных.

Второй подход включал использование предварительно обученной модели сегментации изображений от Nvidia, доступной на HuggingFace. Эта модель, обученная на данных городского пейзажа, успешно справлялась с идентификацией светофоров на изображениях Captcha. Автор разработал сценарий, включающий следующие шаги:

  • измените размер изображения до 1024x1024,
  • используйте библиотеку Python-трансформера для создания экземпляра модели и передачи изображения с изменённым размером в качестве входных данных.

Так как модель возвращает список масок для каждого объекта, который она может идентифицировать, исследователь отобрал маску светофора и смог вычислить, в какой из 16 квадратов он попадает.

Он провёл несколько базовых тестов производительности на различном оборудовании, включая сервисы Hugging Face и RunPod. Оказалось, что обработка на графических процессорах намного быстрее и эффективнее, чем на центральных процессорах. Наиболее экономичным вариантом стал RTX 4000 Ada, который может обрабатывать каждое изображение за 1 секунду и стоит $0,15 в час или $0,05 за 1000 капч.

Автор делает вывод, что, несмотря на успех в области распознавания светофоров, Captcha остаётся важным элементом в многоуровневой системе безопасности. Сервисы, такие как Google ReCaptcha и hCaptcha, используют другие методы контроля и оценки рисков, выходящие за рамки данного исследования. Тем не менее, исследование подчёркивает, что даже базовые знания в области ИИ могут помочь мотивированному хакеру обойти системы Captcha.