Минцифры предлагает обеспечить доступ разработчиков AI к госданным через госоператоров
Москва. 30 ноября. INTERFAX.RU - Разработчики решений в области искусственного интеллекта (ИИ-решений) смогут получать доступ к государственным наборам данных (дата-сетам) через государственных операторов на основе мотивированного запроса.
Это следует из проекта концепции Минцифры, представленного во вторник на расширенном заседании Комиссии РСПП по медиаиндустрии и предпринимательству в информационной сфере. Проект внесен в аппарат правительства для согласования на уровне заинтересованных ведомств.
"Концепцией прежде всего предполагается создание государственных операторов наборов данных. Эти операторы должны определяться правительством Российской Федерации и субъектами - мы понимаем, что операторы должны быть определены не только на федеральном уровне, но в том числе и на уровне субъектов Российской Федерации" - пояснил советник генерального директора "Центра экспертизы и координации информатизации Министерства цифрового развития РФ" (ЦЭКИ) Андрей Никуличев.
Учитывая высокую стоимость создания дата-сетов - стоимость одного набора составляет не менее 1 млн рублей - формировать их планируется на заявительной основе, сказал Никуличев. "Мы должны четко знать, кому эти наборы данных нужны, каким образом они будут использоваться, какой социально-экономический эффект они будут приносить", - отметил представитель ЦЭКИ. При этом для приема заявок планируется организовать "единое окно". Состав и источники данных для набора будут определять сами операторы.
Помимо формирования наборов данных на основании запросов разработчиков, функцией операторов станет также обезличивание данных и обеспечение доступа к дата-сетам в зависимости от класса защищенности. В первый класс войдут общедоступные данные, во второй - обезличенные конфиденциальные данные (содержащие банковскую, налоговую, медицинскую и другие виды тайн), в третий - данные, содержащие гостайну (вопрос доступа к ним остается дискуссионным, признал Никуличев).
В зависимости от класса данных будет регулироваться как список допущенных к ним лиц (ко второму и третьему классу смогут получить доступ лишь аккредитованные разработчики), так и инфраструктура доступа и хранения сведений. Данные, содержащие гостайну, разработчики смогут использовать для обучения ИИ-моделей только на инфраструктуре операторов, без возможности скачивания.
Проверять результаты обезличивания данных, а также правильность отнесения к тому или иному классу чувствительности будут специальные аккредитованные центры безопасности данных.
Предполагается, в 2022-2023 годах разработчики смогут получить доступ к наборам открытых данных, в 2023 году - к обезличенным данным, к 2024 году - и к данным, содержащим гостайну.
Для реализации концепции планируется внести изменения в 149-ФЗ "Об информации, информационных технологиях и о защите информации", 152-ФЗ "О персональных данных" и 8-ФЗ "Об обеспечении доступа к информации о деятельности государственных органов и органов местного самоуправления". Порядок предоставления доступа к государственным наборам данных и перечень операторов планируется определить на уровне правительства РФ.
12 ноября, выступая в ходе конференции AI Journey, президент Владимир Путин потребовал как можно быстрее внести изменения в законодательство, чтобы обеспечить доступ российских разработчиков искусственного интеллекта, научных организаций и бизнеса к массивам обезличенных данных государства.