Отпечатки и user-agent в BAS
Как работает фингерпринтинг браузера в Browser Automation Studio — что входит в отпечаток, почему BAS использует настоящие и как держать согласованную личность для каждого аккаунта.
Отпечаток — это всё, что сайт может узнать о вашем браузере без вашего входа, и современные антибот-системы сильно на него опираются. Большое преимущество BAS в том, что он управляет настоящим браузером с настоящим, целостным отпечатком, но вам всё равно нужно правильно управлять этой личностью для каждого аккаунта.
Что на самом деле входит в отпечаток
Строка user-agent — это та часть, которую знают все, но она маленькая. Полный отпечаток включает:
- User-agent — браузер, версия, ОС.
- Экран и окно — разрешение, глубина цвета, device pixel ratio.
- Canvas и WebGL — как ваше железо отрисовывает графику, что тонко варьируется от машины к машине.
- Шрифты — набор, установленный в системе.
- Часовой пояс и язык — и совпадают ли они с локацией IP.
- Хинты железа — ядра CPU, память, поддержка тача.
Сайты объединяют это в почти уникальный ID. Смена одного в отрыве лишь создаёт противоречия.
Почему BAS использует настоящие отпечатки
Наивная автоматизация либо сливает сигналы «я бот», либо задаёт несколько свойств, которые друг с другом не согласуются. BAS вместо этого применяет полные, внутренне согласованные отпечатки, взятые с реальных браузеров, так что десятки значений выстраиваются так, как было бы на настоящем устройстве. Эта целостность и есть вся суть — детекторы ищут противоречия, а не какое-то одно значение.
User-agent — лишь один сигнал
Задать навороченный user-agent, оставив остальное по умолчанию, хуже, чем не делать ничего: теперь заявленный браузер расходится с canvas, шрифтами и экраном. Относитесь к user-agent как к одному полю внутри отпечатка, а не как к самостоятельной маскировке.
Один отпечаток на аккаунт, держим стабильным
Правило, зеркальное cookies и прокси: каждый аккаунт получает один отпечаток и сохраняет его. У возвращающегося пользователя стабильное устройство. Если аккаунт, всегда выглядевший как десктоп Windows/Chrome, вдруг выглядит как телефон Android — эта несогласованность сильный сигнал бота. Храните отпечаток с аккаунтом и переиспользуйте каждый запуск.
Согласуйте отпечаток, прокси и часовой пояс
Три слоя личности должны совпадать:
- Резидентный прокси США с московским часовым поясом и русским языком — это противоречие.
- Сопоставляйте часовой пояс и локаль с регионом прокси.
- Держите отпечаток, cookies и прокси связанными вместе как одну постоянную личность.
Согласуйте эту тройку — и ваши аккаунты читаются как обычные возвращающиеся пользователи: меньше капч, меньше банов. Когда личность под контролем, последний базовый браузерный навык — запуск нескольких таких параллельно по вкладкам и потокам, о чём дальше.
Вопросы и ответы
Достаточно ли сменить user-agent, чтобы избежать детекта в BAS?
Нет. User-agent — лишь один сигнал. Современные сайты читают также canvas, WebGL, шрифты, экран и десятки других свойств. User-agent, который расходится с остальным отпечатком, подозрительнее, чем если бы вы вообще ничего не меняли.
Что такое отпечаток браузера в BAS?
Это полный набор свойств, который сайт может прочитать из вашего браузера — user-agent, размер экрана, рендеринг canvas и WebGL, установленные шрифты, часовой пояс, язык и прочее. Вместе они образуют почти уникальную личность, по которой сайты узнают посетителей.
Ещё по теме
- Browser Automation Studio: полный практический гидГид
- Создаём первого бота в Browser Automation StudioПошаговый разбор создания первого рабочего бота в BAS — от пустого проекта до процесса, который ходит по страницам, извлекает данные и работает в несколько потоков.
- Настройка прокси в Browser Automation StudioКак правильно настроить прокси в BAS — типы прокси, привязка по потокам, ротация и проверки, которые не дают мультиаккаунт-ботам попасть под бан.
- Поиск элементов в BAS: селекторы, которые не ломаютсяКак работает поиск элементов в Browser Automation Studio — CSS против XPath, почему записанные селекторы ломаются и как писать селекторы, переживающие изменения страницы.