"Интерфакс" предложит конкурсантам "Цифрового прорыва" создать генератор названий для сюжетов
Москва. 17 августа. INTERFAX.RU - Группа "Интерфакс" заявила на хакатон "Креативные индустрии. Коммуникации и контент", проводимый 20-22 августа в рамках конкурса "Цифровой прорыв", задание по анализу и обработке текстов с применением технологий машинного и глубокого обучения.
Чтобы пользователям было проще ориентироваться в информационном потоке дня, "Интерфакс" структурирует новости через тематические подборки - сюжеты. Отбор новостей в тот или иной сюжет происходит автоматически. В сюжеты входят новости, которые посвящены одной теме, событию или объекту.
На базе data-кейса "Интерфакса" участникам конкурса предстоит разработать генератор названий для информационных сюжетов, которые автоматически собирает нейросеть. Сюжеты - это подборки новостей по одной тематике, например, "Встреча Путина и Байдена", "Олимпиада-2020", "Выборы в Госдуму-2021" и т.д.
Решением для этого кейса хакатона станет разработка алгоритма, который будет предлагать название для сюжета с соблюдением набора редакционных требований. На рынке в данный момент нет работающего инструмента с таким функционалом, хотя работу в направлении автоматизации подготовки новостных сюжетов ведет целый ряд коллективов, отмечает руководитель проектов центра программных разработок "Интерфакса" Замир Мусаев.
"Генерация заголовков для групп новостей – пример задачи, легкой для человека, но чрезвычайно сложной для компьютера. Машине сложно "понять" суть новостей, выделить общее, даже составить грамматически правильное предложение. Обычно подобную задачу решают для одной новости, то есть по тексту новости генерируется заголовок. Получается не очень хорошо даже для более простого английского языка: в заголовках часто отсутствуют важные факты, объекты путаются местами, искажая суть новости и пр. А когда нужно "понять" сразу несколько новостей – всё еще хуже. Мы просим участников генерировать короткие заголовки, чтобы они помещались на экраны телефонов. Цель сейчас – помочь пользователям мобильного приложения IFX среди сотен новостей понять, какие главные события происходят в мире. Цель завтра – анализ потока любых текстов (содержимого сайтов, каналов мессенджеров, постов соцсетей) для поиска тем, стоящих внимания и развития редакцией", - рассказал Мусаев.
"Цифровой прорыв" - проект президентской платформы "Россия - страна возможностей". Глобальной целью конкурса является формирование культуры IT-сообщества за счет продвижения лучших участников, а также создание эффективных социальных лифтов в России.
"Участие во всероссийском хакатоне стратегически важно для "Интерфакса" как ИТ-компании, которая развивает множество цифровых сервисов по управлению рисками и анализу информации для B2B и B2G. Постоянная модернизация продуктового портфеля, в том числе с использованием решений на базе искусственного интеллекта, объясняет нашу заинтересованность в притоке квалифицированных ИТ-кадров. Перспективные и интересные наработки в дальнейшем могут быть приняты нами в разработку", - заявил директор по развитию цифрового бизнеса группы "Интерфакс" Олег Полетаев.