Хакатоны

MTS ML CUP 2023

«Я тебя по IP вычислю!» – помните такую угрозу из интернета времен нулевых? в МТС Digital решили выяснить, можно ли составить хотя бы приблизительное представление о человеке, обладая информацией о сайтах, которые он посещает. Для этого в МТС Digital сгенерировали полусинтетические данные.

Вопрос звучит так: сможем ли мы по таким цифровым следам пользователя (на каких сайтах с каких IP он сидел, сколько раз заходил, какое у него устройство) понять, кто этот пользователь? Студент или пенсионер? Мужчина или женщина? 

Действительно, в Digital-рекламе часто сегмент включает себя пол и один из бакетов по возрасту (<18, 18-24, 25-34, 35-44, 45-54, 55-64, 65+). Эта задача особенно актуальна для рекламных DSP-площадок, которые в OpenRTB запросах получают такие данные с частотой 200 000 запросов в секунду со всех сайтов, размещающих рекламу за деньги.

Задача соревнования 
Определение пола и возраста владельца HTTP cookie по истории активности пользователя в интернете на основе ситнетических данных.

Проверка решений:
  • Решения проверяются автоматически. Запуск происходит на полностью закрытых тестовых данных, которые не передаются участникам.
  • На лидерборде рейтинг участников будет рассчитываться по подвыборке ответов из тестовых данных.
  • Кол-во сабмитов в день: 3
  • Метрика соревнования — ROC-AUC – для определения пола, f1 weighted – для определения возраста. Все решения рассчитываются по формуле - 2 * f1_weighted(по 6 возрастным бакетам) + gini по полу.
  •  Возрастные бакеты 18-24, 25-34, 35-44, 45-54, 55-64 65+.

Участники могут объединяться в команды до 4 человек.

Призовой фонд :
  • 1 место - 350 000 рублей
  • 2 место - 200 000 рублей
  • 3 место - 100 000 рублей
+ еще 10 (десять призовых мест) с призами в виде мерча соревнований.

Начало соревнований: 30 января 2023

Регистрация и отправка решений до 15 марта: https://ods.ai/competitions/mtsmlcup
Архив
Made on
Tilda