Электронные информационные ресурсы в области литературного источниковедения
Направления деятельности
- создание собственных источниковедческих ресурсов,
- аккумуляция ресурсов из разных источниковедческих источников,
- сбор информации о музейно-архивных, печатных, электронных ресурсах.
Задачи
1. Информационное обеспечение научной деятельности, источниковедческое сопровождение исследовательских работ в ИРЛИ:
- научных проектов коллективов и сотрудников,
- диссертаций, научных работ и учебной деятельности аспирантов,
соискателей и стажеров;
- предоставление источниковедческих справок по запросам внешних
пользователей: сотрудников учреждений науки, образования и культуры,
студентов и аспирантов.
2. Технологическая поддержка источниковедческих проектов:
- библиографические и справочные электронные базы данных (БД), электронные каталоги,
- CDS/ISIS for Windows - система управления библиографическими и фактографическими базами данных иерархического типа,
- форматы представления библиографических данных UNIMARC и нормативных данных UNIMARC-AUTHORITY,
- технология создания структурированных записей для баз данных из библиографического текста в полуавтоматическом и автоматическом режимах.
Основной проект
Информационно-поисковая система (ИПС) «Русская словесность»
ИПС «Русская словесность» - многобазовый библиографо-фактографический мультимедийный гипертекстовый электронный ресурс, включающий в себя:
- текстовые базы данных, в том числе гипертекстовые*,
- мультимедийные вспомогательные ресурсы.
Гипертекстовая база данных: текстовая база данных, записи в которой содержат связи с другими записями, позволяющими компоновать ансамбли записей на основе их логической связи (см. ГОСТ 7.73-96, п. 3.3.15).
Мультимедийные средства:
• вызов и показ изображений
• вызов и воспроизведение аудиоматериалов
• вызов и воспроизведение видеоматериалов
• включение в электронный ресурс интернет-ссылок для расширения информативности основного электронного ресурса.
Создается с 1993 г. Отдельные этапы работы финансировались Междисциплинарным академическим центром социальных наук (Интерцентр), РФФИ, РГНФ, СПбНЦ РАН, программой Президиума РАН «Филология и
информатика». Технологическая поддержка осуществлялась Отделом информатики Библиотеки Академии наук (зав. к.ф.н.
В.П. Захаров, , Е.Н. Пименов, А.Ц.Масевич).
Система работает в среде CDS/ISIS для Windows (UNESCO). См. портал ЮНЕСКО:
CDS/ISIS database software.
Форматы представления данных -
UNIMARC и UNIMARC-AUTHORITY (IFLA) в версии ИРЛИ (без встроенных полей).
Коммуникативный формат - ISO2709.
Технология подготовки и редактирования данных во внешнем текстовом файле DAT:
- коммуникативный формат данных - DAT-IRLI (разработчики А.Б. Васильев, А.В. Островская);
- комплекс программ выгрузки/загрузки записей БД через обменный текстовый файл в формате DAT (разработчик
В.В. Рубцов). Описание.
При создании данных используется метод обработки во внешней среде (текстовом редакторе): ввод записей осуществляется в текстовом формате, затем происходит конвертация в БД при помощи созданной технологии DAT. Коммуникативный формат DAT предназначен для выполнения широкого комплекса работ, связанных с вводом, корректировкой и обменом записями между базами данных, поддерживаемыми с помощью СУБД ISIS. Обменный файл имеет простую, но строго детерминированную машиночитаемую структуру такого типа, которая позволяет пользователю создавать и редактировать его с помощью любого текстового редактора. Особенностью формата является возможность его применения в любом текстовом редакторе при сохранении коммуникативной функции.
Создан комплекс программных продуктов, который обеспечивает основной цикл обмена данными между WinISIS'ом и внешней средой: программа выгрузки данных из БД, программа загрузки из файла DAT в БД, программы тестирования коммуникативной структуры входного файла DAT.
Подобная технология создания и ведения данных обусловлена специфическим характером ретроспективной источниковедческой работы, а именно, необходимостью ввода в БД библиографической информации, уже существующей в виде печатных указателей и списков. Сканирование текста, распознавание с вычиткой и дальнейшая модификация электронной записи в текстовом редакторе требует значительно меньше времени и дает существенно меньше ошибок, чем клавиатурный ввод данных в СУБД. Кроме того, клавиатурный ввод требует высокой квалификации персонала, в то время как при разработанной нами технологии знание библиографических ГОСТ’ов, электронного формата UNIMARC требуется только на этапе форматирования записей, позволяя привлекать к работе по оцифровке данных студентов и молодых специалистов, а владение навыками работы в СУБД требуется только на конечном этапе создания БД – редактировании и индексировании.
Инструктивно-методические документы
Островская А.В. Технология автоматизированной подготовки беловой рукописи библиографического указателя на основе ППП CDS/ISIS for Windows1.5_3
Нестандартная графика в CDS/WinISIS: десятеричные коды ЮНИКОД
В ИПС «Русская словесность» входят различные типы баз данных (БД):
- Библиографические БД - библиография научных работ по истории и теории литературы (отчасти - устному народному творчеству) и публикаций литературных произведений; приоритетная тематика - история русской литературы XIX в.
- Нормативно-справочные фактографические БД- информация о стандарте представления объекта в системе: лица, организации/творческого коллектива, периодического издания, унифицированного названия анонимного или авторского произведения, тематической рубрики, аббревиатуры, кода и пр. В ИПС "Русская словесность" нормативные базы используются как самостоятельные справочные ресурсы, содержащие информацию из разных источников. Приоритетная тематика - персональные данные
- Технологические БД- библиографические коды, список сокращений и т.д.
- Электронные копии источниковедческих материалов Рукописного отдела ИРЛИ
Библиографические базы данных
БД, полученные извне:
- база данных Института научной информации по общественным наукам РАН (ИНИОН), сер. "Литературоведение" с 1986 г. по настоящее время;
- база данных Российской книжной палаты (РКП), раздел "Русская литература" за 1979-1999 гг. (некоторые годы - частично).
БД собственной генерации:
Нормативно-справочные базы данных
1. Комплекс баз персонально-источниковедческих данных "Лица":
· "Русские писатели первой половины XIX в.". Основной источник - биобиблиографический словарь "Русские писатели. 1800-1917", а также др. источники. БД ориентирована на состав персоналий библиографического
указателя "История русской литературы. Personalia. Первая половина XIX века" и является его справочным сопровождением. БД находится в стадии разработки.
·
"Русские литераторы XVIII-XXI в.: Биографии. Псевдонимы. Иконография. Источники". Основные разработчики:
В.В. Борисова, А.В. Островская. Пример записи
2. БД кратких нормативно-справочных и источниковедческих данных:
· "Периодические издания XVIII-XX вв.".
· "Организации и учреждения XVIII-XX вв.".
Пример записи
БД, созданные на основе материалов Рукописного отдела ИРЛИ
Поиск в БД многоаспектный.
В библиогрфических БД:
• элементы библиографического описания,
• рубрики: персоналии, организации/творческие коллективы, авторские, анонимные и фольклорные произведения, периодические издания,
• ключевые слова,
• коды.
В фактографических БД: по всем значимым элементам записи.
Планы развития
1. Пополнение имеющихся ресурсов информацией из научно достоверных источников.
2. Заполнение тематических и хронологических лакун библиографической части ИПС "Русская словесность" за счет данных:
-
библиографических указателей, изданных в ИРЛИ:
-
картотек Отдела источниковедения: картотека публикаций писем русских писателей К.Д. Муратовой, роспись содержания научных сборников 1960-1980-х гг.
3. Создание на основе ИПС новых узкотематических локальных библиографических БД.
4. Создание ресурсов на основе справочных источниковедческих коллекций Рукописного Отдела ИРЛИ.
5. Представление данных в интернет.
См. также: Островская А.В. Справочно-библиографическая информационно-поисковая система «Русская словесность»