Обеспечение полнотекстового поиска в современных электронных библиотеках
19 октября 2010 года Российская ассоциация электронных библиотек совместно с Российской государственной библиотекой и Главным информационно-вычислительным центром Министерства культуры Российской Федерации провела Интернет-конференцию на тему "Обеспечение полнотекстового поиска в современных электронных библиотеках".
Вел конференцию Груздев Игорь Александрович - директор Российской ассоциации электронных библиотек.
Принимали участие:
Ляпин Сергей Хамзеевич - директор Архангельского областного центра повышения квалификации специалистов культуры,
Куковякин Алексей Валентинович - заместитель генерального директора ООО "Константа",
Лавренова Ольга Александровна - заведующая научно-исследовательским отделом развития компьютерных технологий и лингвистического обеспечения Российской государственной библиотеки,
Шварцман Михаил Ефремович - заведующий отделом Исследования компьютерных систем Российской государственной библиотеки.
Лаврёнова О.А. изложила теорию полнотекстового поиска в электронных библиотеках и высказала замечания по поводу существующих поисковых систем и алгоритмов, не учитывающих основную технологическую задачу поиска по тексту – обеспечение идентификации последовательности знаков, заданных при поиске, в тексте документа. В докладе были приведены примеры поисковых запросов, формальных способов установления идентичности, а также поисковые казусы. Речь шла также о различных системах метаданных, грамматических словарях, тезаурусах, классификаторах и других лингвистических средствах, необходимых для обеспечения полноты и качества полнотекстового поиска.
Ляпиным С.Х. и Куковякиным А.В. была представлена действующая электронная библиотека, базирующаяся на сервере Архангельского областного центра повышения квалификации специалистов культуры, развиваемая на основе информационной системы T-Libra, предназначенной для создания многофункциональных библиотек в Интернет/Интранет-архитектуре с различными возможностями и сервисами. ЭБ умеет взаимодействовать с существующими АБИС, т.е. существующими каталогами. В презентации в режиме реального Интернета был продемонстрирован электронный каталог с поисковой системой, депозитарий, несколько типов поисковых запросов и т.д. Суть сервиса – тематический поиск (линейный до абзацев); поиск терминологических структур, поиск факта. Адрес библиотеки - http://demo.tlibra.ru/bin/tlibra/TauC.exe?DSN=tlibra.
Шварцман М.Е. представил результаты тестирования информационной системы T-Libra, отличающуюся, по его оценке, от других систем того же класса как интерфейсом, так и функциональностью. Главный недостаток, по мнению выступающего, это отсутствие средств интеграции (OAI, Z39.50) с другими системами. Заложенные в систему качества, выгодно отличающие ее от других систем этого класса, в настоящее время трудно использовать. Так для эффективного использования частотного анализа, хорошо бы иметь тезаурус, личный кабинет для эффективного применения в учебном процессе требует возможности совместного использования, а при создании депозитария не учитывались особенности технологии долговременного хранения документов. Также вызывает сомнение необходимость самостоятельной разработки для полнотекстового поиска при наличии открытого ПО, уже реализующего все необходимые функции. Шварцман М.Е. отметил, что уже сейчас эта программа может работать для создания небольших электронных библиотек и выразил надежду на дальнейшее её усовершенствование и развитие.
В заключительной беседе Ляпин С.Х. поблагодарил Шварцмана М.Е. и его коллег за проделанную работу по тестированию системы T-Libra и за высказанные замечания и пожелания, рассказал о новых планах и проделанных шагах в развитии системы T-Libra.
Груздев И.А. зачитал благодарственное письмо-отзыв Барковой О.В. об использовании системы в киевском ООО СЦ «БАЛИ». Он также предложил Интернет-аудитории присылать свои отзывы, замечания и предложения по дальнейшему развитию системы, а разработчикам T-Libra - представить для широкого апробирования её расширенную on-line демоверсию.
В работе конференции в удаленном режиме зарегистрировано 496 участников.
Организаторы конференции выражают свою благодарность всем средствам массовой информации, оказавшим ей информационную поддержку.