Три проблемы управления документацией
Документооборот в строительстве и особенно в нефтегазовой отрасли достигает огромных масштабов. По каждому объекту формируются десятки тысяч файлов строительной, технической и исполнительной документации, зачастую с множественными версиями и в разных форматах. Согласно внутренней статистике «Газпром ЦПС», в среднем на проект приходится более 40 000 документов, а ежемесячный поток составляет 1 500 документов.Значительная часть материалов представлена в виде сканов и «плоских» PDF, что делает их практически недоступными для структурной обработки. Это приводит к дублированию, потерям, ошибкам в атрибутах и разрозненному хранению. Усложняется ситуация тем, что над проектом одновременно могут работать десятки организаций: в среднем их число составляет от 25 компаний. В результате даже такая базовая задача, как найти конкретный шифр или комплект документов к проверке Ростехнадзора, либо при передаче объекта в эксплуатацию, может отнимать у команды много времени.
Проблема усугубляется не только объемом, но и постоянным ростом и усложнением потоков информации. К традиционным бумажным и электронным комплектам добавляются цифровые информационные модели (ЦИМ/BIM), требования по наличию которых закреплены в законе. С 1 января 2022 года для объектов, финансируемых за счет бюджета, стало обязательным формирование и ведение информационной модели (ПП РФ № 331 от 05.03.2021). А в мае 2024 года были утверждены правила, определяющие состав сведений, форматы и порядок ведения такой модели (ПП РФ № 614). Это означает, что даже при неизменных темпах строительства нагрузка на контур исполнительной документации увеличивается за счёт новых данных, версионности и формализованных требований к структуре файлов.
Кадровый дефицит в отрасли усиливает представленные выше сложности. По оценке Правительства РФ, в конце 2024 года в экономике России не хватало порядка 1,5 млн квалифицированных работников, и строительная отрасль входит в число наиболее дефицитных. По данным ФГБУ «ВНИИ труда», дополнительная потребность строительного комплекса до 2030 года составляет около 789 тысяч человек. Это значит, что даже если компании готовы инвестировать в расширение штата, закрыть разрыв в квалификациях быстро не получится, и простое увеличение числа сотрудников не решает проблему.
Вероятность ошибок растет в условиях роста объёма данных и нехватки квалифицированных кадров. Ручная работа с массивами файлов, особенно сканов и «плоских» PDF, требует высокой квалификации, времени и внимания. Ошибки в атрибутах, несвоевременная передача или потеря документов превращаются в фактор риска, способный повлиять на сроки строительства.
Последствия могут быть критичными: если утеряна документация или её невозможно оперативно найти, возникают трудности, например, с определением точного места прохождения подземных сетей. В такой ситуации при земляных работах есть риск повредить коммуникации, что способно привести к аварии и убыткам, исчисляемым до сотен миллионов рублей. Это показывает: потери и ошибки в документообороте становятся не только организационной, но и серьёзной экономической проблемой.
Усложняет ситуацию тот факт, что строительство дорожает: стоимость материалов и работ растёт, а индексы сметной стоимости по данным Минстроя за год увеличились на 9,78%. В таких условиях любая задержка или ошибка в документации прямо конвертируется в затраты.

Универсальные строительные решения не подходят
Во всём строительном контуре — от proptech до промышленного и инфраструктурного строительства — искусственный интеллект перестал быть нишевой технологией. По данным Grand View Research, глобальный рынок ИИ в строительстве уже составляет миллиарды долларов и может вырасти до $16,96 млрд к 2030-му (рост: 26,9% в год) за счёт применения предиктивной аналитики, автоматизации и интеллектуальной обработки проектных данных. В корпоративной недвижимости, где proptech-решения обкатываются быстрее всего, JLL фиксирует, что 61% компаний уже пилотируют ИИ-кейсы, а 90% планируют выстраивать функции CRE с опорой на ИИ и технологии поддержки решений.Параллельно смежные отрасли ТЭК наращивают ИИ-инициативы в производстве и в управлении активами: бенчмарки по использованию ИИ рынку в нефтегазовой отрасли системно указывают на устойчивый двузначный рост сегмента на ближайшее десятилетие: с $2,9 млрд долларов в 2024 году до $6,4 млрд к 2033-му. Эти тенденции объясняются попыткой отрасли закрыть разрыв между темпом генерации данных и доступностью квалифицированных ресурсов для их обработки.
Однако перенос универсальных proptech-решений в нефтегазовые проекты без дополнительной доработки трудно осуществим. Фундаментальная причина — профиль и специфика данных. Отсюда вытекает ключевое инженерное требование к любой системе для нефтегазовых проектов: обязательная отраслевая адаптация алгоритмов, дообучение на крупных массивах «родных» документов и сценариев (претрейн). Без такой адаптации модели (LLM — большие языковые модели) выдают много шума: путают шифры и реквизиты, неустойчиво извлекают сущности из сканов, теряют связность между документами и объектами.
Здесь критично, что доступ к таким массивам есть у реальных действующих на рынке компаний. Например, «Газпром ЦПС», разработчик технического каталога документации с применением ИИ «АФИДА», аккумулировал значимый корпус данных, достаточный для отраслевого претрейна и устойчивой валидации продукта. Дополнительно компания апробировала методику, позволяющую дообучить модель на данных компании-пользователя решения, что также повышает точность работы нейросети.
Как ИИ помогает с документами в нефтегазовых проектах
С учетом сказанного выше про отраслевой претрейн и доступ к крупным корпусам ИД, логика применения ИИ в реальном проекте выглядит так. Сначала в систему попадает «сырой» поток: сканы, фото документов от подрядчиков. На этом этапе модель, дообученная на отраслевых документах, решает прикладные задачи приёма: автоматически определяет тип документа (акт, журнал, паспорт, сертификат и другие), извлекает ключевые реквизиты (шифры, объекты капитального строительства, даты, участники), связывает документ с нужным участком дерева проекта и сохраняет полный распознанный текст для дальнейшего поиска.Далее срабатывает уровень нормализации и валидации. Автоматически заполненные атрибуты проходят пост проверку специалистом, версии документов фиксируются, исключаются дубликаты, а статус каждого экземпляра становится прозрачным для всех вовлеченных подрядчиков. На практике это снимает типовые узкие места: поиск актуальных версий перестает занимать много времени, исключается расхождение в версиях документов у разных контрагентов.
Третий слой — операционное управление сдачей ИД по план-факту. Подрядчики передают документы, система видит фактическую загрузку и автоматически сопоставляет ее с планом (графиком). Разрывы и просрочки подсвечиваются заранее, пока их еще можно исправить: заказчик и генподрядчик видят, у кого из исполнителей накапливается отставание, какие документы блокируют последующие этапы. В результате контроль перестраивается из постфактум-проверки в упреждающий режим, что напрямую решает задачи сокращения календарных рисков на дорогих стройках.
Четвертый слой: работа с ИД как с источником данных для производства и эксплуатации. За счёт полнотекстовой индексации ищутся не только карточки по атрибутам, но и смысловые фрагменты внутри документов: от объёмов работ до марок оборудования. Это критично в прикладных сценариях. Если комплект утерян или найден не полностью, систему можно использовать для восстановления цепочки по смежным связям. Такой поиск также становится фактором промышленной безопасности. Например, дает возможность подтвердить трассировку сетей в конкретном месте. Аналогично решается проблема утерянных паспортов: вместо недель переписки с заводом-изготовителем восстанавливаются данные из корпуса документов и связанных поставочных комплектов.
Система также работает в связке с ЦИМ/BIM: модель открывается прямо в интерфейсе, пользователь выбирает нужный элемент, и система мгновенно подтягивает связанные документы (акты, журналы, паспорта, сертификаты) в одном окне. Это ускоряет навигацию от объекта к документу и снижает вероятность ошибок при поиске актуальной версии.
Наконец, ИИ включается в формирование самой исполнительной документации там, где это допустимо методически и регуляторно. Уже сейчас акты заполняются на основе справочных данных и подтягивания сведений из паспортов или сертификатов материалов: система извлекает нужные поля из приложений, формирует черновик и отдаёт его на проверку ответственному специалисту. С точки зрения бизнеса это означает, что такие ручные этапы как перепечатка реквизитов, поиск подтверждающих сканов, сверка с последними версиями превращаются в проверку готового проекта, а не набор параллельных задач для нескольких специалистов.
Использование этой совокупности функций ИИ в решении «АФИДА» выражается в конкретных преимуществах для компаний, которые применяют продукт при управлении нефтегазовыми проектами:
- Поиск и доступ: время на поиск нужного акта или шифра сокращается с часов до 2–5 минут за счет распознавания, нормализации атрибутов и полнотекстового индекса. Экономия времени на практике составляет до 80%.
- Качество базы: доля корректно описанных документов стабильно выше 95%, доля дублей менее 1%, при этом обеспечивается доступ к актуальной версии с прозрачной историей изменений.
- Время на оцифровку комплекта приемо-сдаточной документации по сравнению с инструментами без ИИ снижается на 70%.
- Каталогизация и архив: работа контрактных специалистов по обработке ИД ускорена в 2 раза.
- Верификация документов. Проверка со стороны всех участников процесса ускорена на 50%.

Как внедрять и где это работает
Подобные решения применимы на любом этапе жизненного цикла: их можно закладывать в проект с нуля, подключать на стадии активного строительства и вводить уже на действующих объектах, чтобы поднять архивы ИД и навести порядок в текущем потоке. Типовое развертывание на действующей стройке занимает 2–3 недели, включая базовую настройку и запуск в работу.При выборе конкретного вендора важно, чтобы решение могло быть развернуто во внутреннем контуре организации. В «АФИДА» такой подход является приоритетным. Также доступны две конфигурации продукта:
- с ИИ-функциями (LLM/ML), в этом случае на серверной стороне требуются GPU;
- без ИИ, здесь достаточно обычных серверов без дорогостоящих видеокарт.
При выборе решения для каталогизации и управления документацией в нефтегазовых проектах важно, чтобы продукт входил в реестр отечественного ПО Минцифры. Это подтверждает импортонезависимость и адаптацию к требованиям безопасности для критической информационной инфраструктуры, а также соответствие регуляторным процедурам (включая практику соблюдения приказов ФСТЭК). «АФИДА» зарегистрирована в реестре Минцифры в августе 2025 года, а в рамках совместимости продукт протестирован на российских корпоративных ОС (например, Astra Linux, RED OS), разворачивается в типовой ИТ-среде заказчика и интегрируется с ней (СЭД/архивы, системы документооборота и хранилища файлов), без необходимости перестраивать бизнес-процессы.

Автор: Е. Данильчук