USD 65.6046

0

EUR 72.6243

0

BRENT 58.8

-0.33

AИ-92 42.31

0

AИ-95 46.04

-0.03

AИ-98 51.8

+0.04

ДТ 46.03

+0.01

74

Электронная библиотека ?Нефть и газ?

Для выяснения возможности создания достаточно большой электронной библиотеки, для использования в высшем учебном заведении, проведена исследовательская работа. Результаты исследований дали положительный результат и показали техническую возможность создания библиотек более высокого уровня

Для выяснения возможности создания достаточно большой электронной библиотеки, для использования в высшем учебном заведении, проведена исследовательская работа. Результаты исследований дали положительный результат и показали техническую возможность создания библиотек более высокого уровня - для производственно-технических отделов промышленных предприятий и в дальнейшем - для научно-исследовательских учреждений.
Решены технические вопросы, связанные со сканированием, передачей информации по сетям, каталогизацией, обработкой изображений, распознаванием текстов, совмещением растровых и векторных изображений, индексацией текстового материала, разработкой сервисных программ и системы поиска для пользовательской программы.
Сканирование производилось при помощи планшетного сканера в 70% случаев, т.е. около 700 книг отсканировано вручную, 300 - с автоподачей. В результате сканирования 1000 книг с разрешением 300 dpi получено около 300 000 файлов формата *.tif. общим объемом - 20 GB. Полученные файлы преобразованы в формат *.djvu, общим объемом - 5 GB, а также распознаны в файлы *.txt, общим объемом - 700 МВ. В сумме общее количество файлов - около миллиона. Пользовательский вариант, включая поисковую систему и файл индексации, занимает 7,88 GB. При обработке данных использовалось свободное от учебных занятий время двух компьютерных классов (по 15 компьютеров с тактовой частотой 500 и 900 МГц), три сервера и четыре сканера (один из них сетевой), объединенных сетью. Весь объем информации переработан за несколько недель. Производительность системы ограничивается только самым медленным этапом - сканированием. Максимальная производительность машинной системы - 60 тыс. книг/год (18 млн. стр.) при 24-х часовой загрузке машин, может быть достигнута увеличением количества устройств ввода информации до 12 сканеров, с 8-ми часовым рабочим днем, при условии достаточного дебита ?месторождения? информации, т.е. источников книг или исходной бумажной библиотеки.
Разработаны сервисные программы:
для переименования файлов, содержащая также модуль сравнения файлов и выявления ошибок; для определения страниц содержания и предметного указателя для последующего быстрого поиска; лингвистического анализа содержания, составляющая полный словарь и модуль предварительного отбора книг по файлам, содержащим полный предметный указатель и программа для индексации текста.
Разработана программа для пользователей библиотеки, совмещающая функции просмотра и поиска. Интерфейс программы в режиме просмотра содержит два поля - список книг библиотеки и окно просмотра растровой картинки страницы. При необходимости использования части текста или цитат, страница в распознанном виде выводится в отдельном окне. В режиме ?поиск? программа содержит окно для ввода запроса, вывода результатов поиска, в котором можно выбрать необходимую страницу в растровом и текстовом (распознанном) виде. При необходимости сохранения результатов поиска текст всех найденных страниц сохраняется с указанием номера страниц и источника для дальнейшей работы в стандартном редакторе. Опции поиска ограничены выбором количества найденных страниц, ?любые сочетания? или вся фраза и ?fuzzy? - с применением алгоритма нечеткой логики.
Электронная библиотека объединяет тему ?Нефть и газ? по технологии переработки углеводородного сырья, машинам и аппаратам химических производств, бурению и разработке нефтяных и газовых скважин, охране труда и промышленной безопасности, а также по общим дисциплинам технического вуза.


Автор: Айрат Абызгильдин, зав. каф., д.т.н, Уфимский Государственный Нефтяной Технический Университет

Источник : Neftegaz.ru

Система Orphus