USD 97.9559

0

EUR 104.2533

-0.6

Brent 72.03

+0.17

Природный газ 2.897

-0.01

2 мин
...

Росатом создал отраслевой реестр датасетов для обучения искусственного интеллекта

Система проходит процедуру регистрации в реестре российского ПО

Росатом создал отраслевой реестр датасетов для обучения искусственного интеллекта

Москва, 24 мар - ИА Neftegaz.RU. Росэнергоатом (входит в электроэнергетический дивизион Росатома), Консист-ОС (дочка концерна) и частное учреждение по цифровизации атомной отрасли Цифрум (входит в Росатом) завершили пилотный проект по созданию отраслевой системы по учету и хранению паспортов датасетов, которые повторно могут быть использованы для обучения искусственного интеллекта.
Об этом сообщила пресс-служба Росатома.

В настоящее время в базу загружены 12 пилотных паспортов датасетов, созданных Росэнергоатомом и компанией Цифрум в рамках проектов с использованием искусственного интеллекта и машинного обучения.
Система проходит процедуру регистрации в реестре российского ПО.

Тезисы сообщении директора департамента управления ИТ-проектами и интеграцией Росэнергоатома О. Шальнова:
  • на текущий момент уже накопился большой объем датасетов, которые используются для обучения искусственного интеллекта в рамках различных проектов;
  • в связи с этим перед Росэнергоатомом и отраслью в целом встал вопрос создания их реестра и реализации возможности повторного использования уже имеющихся датасетов в других проектах;
  • это позволит существенно сократить время и трудозатраты на подготовку данных для создания новых моделей.
Отмечается, что каждый датасет размещается в реестре вместе с подробным описанием его содержания, назначения и истории использования.
Эта информация позволяет оценить:
  • потенциальную пригодность конкретного набора данных для решения других задач;
  • варианты его последующего использования.
Наличие реестра также позволяет в случае сбоев в работе систем с искусственным интеллектом легко найти исходные данные, на которых обучалась данная нейросеть, провести анализ и внести необходимые корректировки в модель.

Проект реализован в рамках программы Росатома «Сквозные цифровые технологии и управление данными» и направлен на создание единой платформы для отраслевого реестра датасетов, моделей машинного обучения, методологий решения типовых задач в области искусственного интеллекта.
Реализация проекта также решает задачу безопасного использования искусственного интеллекта на предприятиях атомной отрасли.

Для любознательных напомним, что датасет - это совокупность данных в терминах задач машинного обучения и их описания.
Паспорт датасета содержит информацию о его содержании, владельце и цели использования, а также позволяет оценить его применимость для решения задач потребителя, определить способы загрузки и варианты последующего использования.

Напомним, что в мае 2020 г. стало известно, что Росэнергоатом направит от 12 до 14 млрд руб. на 3 больших центра обработки данных (ЦОД), которые концерн планирует построить в России.
Средства пойдут на строительство зданий, создание инфраструктуры и сетей.



Автор: А. Игнатьева


Новости СМИ2




Подписывайтесь на канал Neftegaz.RU в Telegram