Cоревнование по машинному обучению с уникальным датасетом и задачами: находить одних и тех же пользователей по их поведению на данных транзакций и кликстрима.
Общий призовой фонд 2 000 000 ₽
Основные задачи Задача №1 MATCHING Необходимо построить алгоритм для решения задачи матчинга. По данным транзакций и кликстрима, требуется построить обезличенные вектора для пользователей. Затем, на основе созданных векторов, сопоставить каждому вектору транзакций клиента Банка вектор на основе кликстриминга от партнера и отранжировать их по вероятности матчинга. Метрика - R1 Формат решения - Контейнер с кодом Призовой фонд: 1 450 000 ₽
Задача №2 PUZZLE Необходимо построить алгоритм, решающий задачу матчинга в случае, когда все кандидаты в пары заранее известны, но сами пары не предоставлены. Участникам нужно решить всё ту же задачу соотнесения, но в постановке, близкой к составлению пазла. Метрика - R1 Формат решения - Размеченный файл Призовой фонд: 300 000 ₽
Дополнительные задачии активности Номинация 1 COMPANION Награда за лучшие публичные решения, опубликованные до окончания соревнования. Номинация публичная, в ней участвуют публично открытые решения и материалы участников соревнований Призовой фонд: 150 000 ₽
Номинация 2 INSIGHT Награда за самые интересные, прорывные и нестандартные решения задач соревнования. Призовой фонд: 100 000 ₽
Образовательная задача EDUCATION Упражнение для тех, кто хочет научиться работать с индустриальными данными транзакций: создать алгоритм, способный предсказывать наличие высшего образования у клиента. Подарки
Уникальность датасета С помощью инструментов Platforma, а также технологии безопасного матчинга data exchange был сформирован синтетический датасет на обезличенных данных от ВТБ и Ростелекома. При этом данные генерировались таким образом, чтобы сохранить необходимую для решения задачи информацию о пользовательском поведении.
Как будут оцениваться решения соревнования? Решения задач соревнования (1-3) оцениваются автоматически, на основе сопоставления с истинными тестовыми метками, которые доступны только организаторам. Заявки в специальные номинации оцениваются жюри из представителей организатора соревнования, а также приглашенных экспертов и исследователей после окончания приёма решений.
Как выбираются финальные решения? В каждой задаче можно выбрать до 2 своих финальных решений. На протяжении всего соревнования можно выбирать финальные решения, в том числе менять свой выбор. Если финальные решения не были выбраны, то автоматически выбираются 2 лучших решения на публичной части тестовых данных. Результаты на публичных тестовых данных доступны в течение хода соревнования, но не используются при определении победителей соревнования.
Можно ли решать сразу несколько задач? Можно. Принимать участие разрешено как в какой-то одной задаче или активности, так и в любой их возможной комбинации.
Можно ли участвовать в командах? Участие во всех задачах возможно в командах от 1 до 4 человек.
Как определяются победители задач соревнования? В каждой из задач, которые решает участник, необходимо выбрать до 2 своих финальных решений. Эти решения будут запущены и оценены на закрытых приватных тестовых данных. Именно результат на приватных данных считается официальным финальным результатом соревнования. Победителями в каждой из задач становятся участники или их команды, получившие лучшие результаты в рейтинг финальных результатов.