она будет реализована в современной реляционной СУБД (InterBase,
MsSQL, MySQL, Oracle и т.п.) [6]. Особенностью предлагаемого реше-
ния является отказ от хранения структур знаний в плоских файлах [3].
Поскольку быстрый поиск — это основное преимущество СУБД, то
можно отказаться от типизированных файлов DB_TXT.dbi и
DB_ZZZ.dbi. Данные, которые хранятся в файлах DB_TXT.db и
DB_ZZZ.db, можно объединить, так как они являются характери-
стикой одной и той же сущности “Документ”. Для ускорения работы
следует отдельно хранить заголовок документа, так как чаще всего
отображаются не документы, а именно заголовки, которые предста-
вляют собой первые несколько слов документов. Файлы NET2.slv и
NET2.ind представляют собой единую сущность “Слово”, которая ха-
рактеризуется самим словом, частотой и списком документов, в кото-
ром оно встретилось. Характеристика “частота” используется, чтобы
показать, сколько раз то или иное слово встречается во внешней БЗ.
Если в результате удаления документа эта характеристика становится
равной нулю, это слово удаляется. Для создания экземпляра сущности
“Слово” необходимо во время загрузки каждого документа разбирать
его, преобразуя каждое слово в нормальную форму (единственное
число, мужской род, именительный падеж для существительных), и
уже после этого заполнять соответствующие таблицы. Для ускорения
работы выделена отдельная сущность “Набор документов”. Схема
такой БЗ представлена в табл. 2.
Таблица 2
Структура БЗ в современной СУБД
Сущность
Атрибут
Документ
Номер документа
Текст
Семантическая сеть
Заголовок
Слово
Номер слова
Слово
Частота
Набор документов
Номер набора
Номер слова
Номер документа
Каталог ФИО
Номер ФИО
Номер документа
ФИО
Каталог паспортов
Номер каталога паспортов
Номер документа
Серия и номер паспорта
Как видно из схемы, все данные, необходимые для того, чтобы си-
стема работала так же, как и с БЗ на плоских фалах, сохранены. После
116 ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2008. № 2