активной части БЗ, находящейся в оперативной памяти, куда подкачи-
ваются структуры из внешней БЗ, и где они обрабатываются.
Существующая (внешняя) БЗ представляет собой набор плоских
файлов (табл. 1). В ней хранятся следующие данные: тексты загру-
женных в систему документов (DB_TXT.db), семантические сети
(DB_ZZZ.db), каталоги и индексы, которые автоматически строят-
ся на их основе. Кроме того, есть еще два типизированных файла
(DB_TXT.dbi, DB_ZZZ.dbi), в которых хранится информация о том,
на какой строке файлов БД с текстами и семантическими сетями начи-
наются документы, и какая у них длина. Это сделано для организации
более быстрого доступа к данным [1].
Таблица 1
Структура существующей БД
Файл
Содержание
Атрибуты
DB_TXT.db Текст документа
Текст
Длина
DB_TXT.dbi Типизированный текст
Номер документа
Смещение
Размер
DB_ZZZ.db Семантическая сеть документа
Семантическая сеть
Длина
DB_ZZZ.dbi Типизированная семантическая сеть
Номер семантической сети
Смещение
Размер
NET2.slv
Индексный файл
Слово
Частота
Смещение
NET2.ind
Набор документов
Длина
Набор документов
В БД есть два индексных файла. Первый (NET2.slv) — представляет
собой перечень ключевых слов, найденных в семантических сетях,
частоту их появления во всех документах и адрес (смещение) списка
документов во втором файле (NET2.ind), в которых были найдены эти
слова. Ключевыми являются слова, по которым осуществляется поиск.
К ним не относятся предлоги, частицы, союзы и т.п.
На этапе загрузки строятся файлы с каталогами основных объек-
тов, по которым проводится быстрый поиск по БД. Такими объектами
могут быть, например, адрес, телефон, ФИО [3].
Работа с внешней БЗ осуществляется с помощью стандартных
функций языка ДЕКЛ [4, 5]. Перечень основных функций и про-
цедур — это запись семантической сети, запись текста загруженного
файла, запись индексов и т.д.
Структура внешней БЗ в реляционной СУБД.
В этом разде-
ле предлагается структура внешней БЗ системы исходя из того, что
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2008. № 2 115