Об этом сообщила пресс-служба Росатома.
В настоящее время в базу загружены 12 пилотных паспортов датасетов, созданных Росэнергоатомом и компанией Цифрум в рамках проектов с использованием искусственного интеллекта и машинного обучения.
Система проходит процедуру регистрации в реестре российского ПО.
Тезисы сообщении директора департамента управления ИТ-проектами и интеграцией Росэнергоатома О. Шальнова:
- на текущий момент уже накопился большой объем датасетов, которые используются для обучения искусственного интеллекта в рамках различных проектов;
- в связи с этим перед Росэнергоатомом и отраслью в целом встал вопрос создания их реестра и реализации возможности повторного использования уже имеющихся датасетов в других проектах;
- это позволит существенно сократить время и трудозатраты на подготовку данных для создания новых моделей.
Эта информация позволяет оценить:
- потенциальную пригодность конкретного набора данных для решения других задач;
- варианты его последующего использования.
Проект реализован в рамках программы Росатома «Сквозные цифровые технологии и управление данными» и направлен на создание единой платформы для отраслевого реестра датасетов, моделей машинного обучения, методологий решения типовых задач в области искусственного интеллекта.
Реализация проекта также решает задачу безопасного использования искусственного интеллекта на предприятиях атомной отрасли.
Для любознательных напомним, что датасет - это совокупность данных в терминах задач машинного обучения и их описания.
Паспорт датасета содержит информацию о его содержании, владельце и цели использования, а также позволяет оценить его применимость для решения задач потребителя, определить способы загрузки и варианты последующего использования.
Напомним, что в мае 2020 г. стало известно, что Росэнергоатом направит от 12 до 14 млрд руб. на 3 больших центра обработки данных (ЦОД), которые концерн планирует построить в России.
Средства пойдут на строительство зданий, создание инфраструктуры и сетей.
Автор: А. Игнатьева