Но непонятно, как собирать и структурировать эту разнотипную кадровую, финансовую, бухгалтерскую, маркетинговую информацию. Что обычно делают в организациях: раскладывают бумажные экземпляры по папкам. Или предварительно их сканируют и сохраняют в виде PDF. Но даже оцифрованные файлы разных форматов непригодны для аналитики – они не машиночитаемы (то есть информационные системы не могут вычленить оттуда текст, графики и другие данные).
При такой схеме на поиски и обработку нужных счетов или договоров могут уйти часы или даже дни. Ситуация усложняется пропорционально объему документов – если проанализировать нужно не несколько десятков файлов, а сотни? Или для отчетности и стратегического планирования нужные данные из тысячи различных документов?
И хорошо, когда точно известно, что искать. Но, что если вы, например, хотите собрать коммерческие предложения поставщиков за прошлые годы и сравнить цены на конкретную деталь? При этом, вы не помните ни названия компаний, ни когда вам эти КП присылали. Или вам нужно наглядно (на графике) продемонстрировать, как увеличивалась стоимость обслуживания программы ДМС за 10 лет.
Перевести подобные операции в автоматический режим позволяет комплексное ИТ-решение – интеллектуальный архив. Это электронное хранилище документов, интегрированное с интеллектуальными средствами анализа и поиска текстовой информации и мощной адаптивной BI-системой.
Да, имеющиеся бумажные документы придется отсканировать (вручную сотрудникам или при помощи подрядчиков со специальным оборудованием). Но дальше весь процесс возьмут на себя цифровые ассистенты в интеллектуальном архиве, освободив время и силы реальных сотрудников для решения творческих задач.
Как работает интеллектуальный архив
Пользователи могут взаимодействовать с решением, просто задавая в окне интерфейса любые вопросы на естественном языке. В ответ получая перечень релевантных документов или аналитические дашборды.Работу системы можно разделить на два основных процесса: 1) сбор, структурирование информации и 2) аналитика, получение ответов на неформализованные запросы.
Текстовый слой из отсканированных документов извлекает и распознает продукт SOICA (OCR-технология): конвертирует отдельные символы и слова в электронный текст, который после можно редактировать, сохранять и использовать для поиска, анализа или других целей.
Программные роботы ROBIN (RPA) собирают документы и данные из используемых в компании информационных систем. И передают их на хранение в сервис хранения «Цитрос».
Далее информация поступает на интеллектуальную обработку в сервисы индексирования, выделения фактов и их взаимосвязей. За этот процесс отвечает инструмент текстовой аналитики «Преферентум» (ML/AI).
Основные компоненты и схема работы интеллектуального архива
Сотрудники компании работают с веб-порталом, где задают любые нужные им вопросы на естественном языке. Процессы скрыты от пользователя - сотрудникам не требуется специальных знаний в программировании или анализе данных.
Какие задачи можно поставить системе (несколько примеров):
- Найти договоры с текущими поставщиками и проверить, были ли соблюдены условия этих договоров.
- Проанализировать, как с годами изменялась стоимость лабораторного оборудования.
- Выяснить, как часто требовался ремонт компрессоров на конкретной буровой.
- Какие товары и в каком объеме закупали у выбранного поставщика последние полгода.
- Найти все рапорты майора Иванова за период несения дежурства в 2021 году. Год рождения Иванова 1987.
- Покажи, как менялась цена за услугу «Техническое обслуживания ПО»за последние пять лет.
- Покажи мне все КП (номер, дата) с общей стоимостью более 5 млн рублей от поставщика АО “Ромашка”?
- Как менялась средняя стоимость процедуры МРТ за последние 10 лет? Построй график!
- Покажи список поставщиков и их email с контактными лицами для рассылки запросов ценовой информации/участия в торгах
Ответы пользователям предоставляются в понятном и наглядном виде, можно посмотреть перечень документов-источников данных. Визуализация и анализ данных, их отображение в понятном виде реализовано с помощью продуктов Polymatica (BI).
Доступ к данным в интеллектуальном архиве можно фильтровать, то есть настраивать его для различных групп сотрудников. Сложное обучение пользователей тоже не требуется. Сотрудникам достаточно показать пару примеров формулировки запросов.
Конечно, человек может придумать такой вопрос, на который решение не сможет подобрать ответ, даже имея доступ ко всем данным. Тогда стоит упростить задачу, разделить запрос на отдельные части. Но даже в этом случае внедрение интеллектуального архива экономит колоссальное количество «человеко-часов», которые бы потребовались на поиск и обработку информации. И дает возможность анализировать больше аспектов деятельности компании – а значит, повышает бизнес-эффективность и позволяет оперативно и обоснованно принимать решения.
Автор: Е. Данильчук