Вопрос звучит так: сможем ли мы по таким цифровым следам пользователя (на каких сайтах с каких IP он сидел, сколько раз заходил, какое у него устройство) понять, кто этот пользователь? Студент или пенсионер? Мужчина или женщина?
Действительно, в Digital-рекламе часто сегмент включает себя пол и один из бакетов по возрасту (<18, 18-24, 25-34, 35-44, 45-54, 55-64, 65+). Эта задача особенно актуальна для рекламных DSP-площадок, которые в OpenRTB запросах получают такие данные с частотой 200 000 запросов в секунду со всех сайтов, размещающих рекламу за деньги.
Задача соревнования
Определение пола и возраста владельца HTTP cookie по истории активности пользователя в интернете на основе ситнетических данных.
Проверка решений:
- Решения проверяются автоматически. Запуск происходит на полностью закрытых тестовых данных, которые не передаются участникам.
- На лидерборде рейтинг участников будет рассчитываться по подвыборке ответов из тестовых данных.
- Кол-во сабмитов в день: 3
- Метрика соревнования — ROC-AUC – для определения пола, f1 weighted – для определения возраста. Все решения рассчитываются по формуле - 2 * f1_weighted(по 6 возрастным бакетам) + gini по полу.
- Возрастные бакеты 18-24, 25-34, 35-44, 45-54, 55-64 65+.
Участники могут объединяться в команды до 4 человек.
Призовой фонд :
- 1 место - 350 000 рублей
- 2 место - 200 000 рублей
- 3 место - 100 000 рублей
Начало соревнований: 30 января 2023
Регистрация и отправка решений до 15 марта: https://ods.ai/competitions/mtsmlcup