07.10.2023 | Трекер следующего поколения: как URL-адрес передаёт ваши данные маркетологам |
Добавление параметров в URL -адреса, техника добавления данных в конец веб-ссылок, стала серьезной проблемой для конфиденциальности данных пользователей. Такой метод используется для передачи данных, включая адреса электронной почты, рекламным компаниям для отслеживания пользовательской активности. Несмотря на планы ограничения использования сторонних cookie -файлов в Chrome в следующем году, специалисты в сфере данных продолжают находить новые способы отслеживания пользователей. Согласно исследованию Шаур Мунира, аспиранта Университета Калифорнии в Дэвисе, около 73% из 20 000 анализируемых сайтов добавляют данные в URL для отслеживания активности посетителей. Мунир представил инструмент на базе машинного обучения под названием PURL , который помогает выявлять и обезвреживать изменения ссылок, используемые для отслеживания. По утверждению Мунира, PURL работает эффективнее, чем другие средства противодействия отслеживанию. Добавленные параметры в ссылке включают путь к ресурсу, параметры запроса и фрагменты. Именно они используются для хранения и передачи данных, что ставит под угрозу конфиденциальность пользователей. Мунир привёл пример URL-адреса с оформлением ссылки, в котором присутствуют параметры отслеживания: http://go[.]artinstitutes[.]edu/search/brand/local/PSGLC?source=BGNAG&ven=search&amp.... =Exact&gclid=KjwKEAjwq6m3BRsdfdfsdfCP7IfMq6Oo9gsdfACRc0bN3J-fcQ1t1DdfO5AyuTfKIyFbg TFPfCmPXyGdrKRBoCmv3w_wcB В этом URL-адресе та часть, которая начинается с ключа «gclid», содержит идентификатор отслеживания. Другой пример:
https://example[.]com/page?utm_source=newsletter&utm_medium=email Здесь utm_source и utm_medium — это добавленные параметры для отслеживания источника трафика. По данным Мунира, 69,4% проверенных сайтов передают информацию, хранимую в cookie-файлах, через добавление параметров в URL. Проблема заключается в том, что параметры могут иметь как функциональное, так и отслеживающее назначение. И, хотя использование дополнительных данных для отслеживания не является новой проблемой, в последние годы это стало особенно актуальным. Учитывая ограничения по использованию сторонних cookie-файлов, специалисты по рекламе стали использовать другие техники – первичные cookie-файлы и цифровые отпечатки (fingerprint). Мунир отметил, что такие платформы, как Google Analytics, активно используют первичные cookie-файлы, а отслеживание по адресам электронной почты и номерам телефонов становится все более распространенным. Согласно исследованию на основе выборки 20% из миллиона лучших сайтов, было обнаружено около 45 миллионов изменений ссылок. Причем около 45% из них были определены как рекламные и отслеживающие. Однако простое удаление параметров может нарушить работоспособность сайта. Так, PURL обнаружил, что почтовые адреса, введенные на веб-страницах, часто передаются третьим лицам, иногда даже в незашифрованном виде. Кроме того, некоторые платформы полагаются на email-адреса для идентификации пользователей. Мунир заявил, что автоматизированный подход PURL, использующий машинное обучение, необходим для борьбы с масштабной проблемой отслеживания в сети. PURL показал точность в 98,74%, что делает его одним из наиболее эффективных инструментов в этой области. Мунир также подчеркнул необходимость внедрения автоматизированных решений для противостояния сложности и масштабу современных методов отслеживания. |
Проверить безопасность сайта