ЗАДАЧА
01
Часто появляющиеся новости в сфере технологий и инноваций не имеют первоисточника, не связаны с указанным в статье экспертом или имеют колоссальные искажения по сравнению с изначальной публикацией или пресс-релизом. Это говорит о том, что эти новости и материалы можно отнести к поддельным. Задача призвана решить проблему поддельных новостей, которые мы потребляем из международных и российских СМИ.
1 место
300 000 ₽
2 место
200 000 ₽
3 место
100 000 ₽
1 МЕСТО
NorthShine
Москва, Киров, Новосибирск, Уфа
Команда: Павел Злоказов, Полина Бескоровайная, Светлана Кучуганова, Антон Полегенько, Антон Лабунский
Решение: Создали веб-приложение для анализа новостей на достоверность. Приложение имеет различные возможности для пользователей и администратора.
Пользователи могут проверять новость по ссылке или просто тексту на достоверность, находить первоисточник, просматривать статистику проверки источников.
Оценка достоверности складывается из нескольких критериев:
• присутствие источника новости в white-листе
• семантическая близость новости с новостью оригинала
• различия в тональности с новостью оригиналом
• уникальность текста
2 МЕСТО
Geek'a Chad
Москва, Челябинск
Команда: Егор Смирнов, Борис Груздев, Роман Смирнов, Семён Кошкаров, Дмитрий Хуторной
Решение: Алгоритм на основе проверенного списка источников новостей позволяет определить степень достоверности произвольного текста, а также выделяет части новости, которые были искажены.
Особенность подхода заключается в уникальном алгоритме фрагментации текста на ключевые элементы, которыми могут быть как словосочетания, так и группы предложений. Именно этот подход позволяет преодолеть ограничение
современных NLP моделей по длине анализируемых текстов.
3 МЕСТО
Ezee
Москва, Красногорск, Химки, Санкт-Петербург
Команда: Александр Сергеев, Алексей Шкиль, Мария Рубаненко, Игорь Боровик, Алиса Аленичева
Решение: Система выделяет семантическое ядро, проводит фактчекинг и сравнивает с фактами в анализируемой статье. В случае различия — статье начисляются «штрафные баллы».
Далее оценивается количество и «качество» СМИ, которые «перепечатывали» статьи. Если первоисточником было малоизвестное СМИ, статья не была размещена ни на одном из «доверенных»
СМИ, снова начисляются «штрафные» баллы.
Штрафные баллы также начисляются за орфографические ошибки, «кликбейтность», индекс «воды», эмоционально окрашенные слова и 10+ других признаков. По сумме штрафных баллов определяется
индекс фейковости новости
Сервис проверки поддельных новостей (fake news) в сфере технологий и инноваций
Сервис по размещению и поиску задач для волонтеров
Сервис по сбору и анализу информации о продукции производителей Москвы для развития импортозамещения
Рекомендательный сервис для оценки эффективности новых цифровых каналов продвижения продуктов банка
Чат-бот помощник для сохранения фокуса в процессе обучения через рефлексию и постановку целей