Класс формальных языков и алгоритм для построения семантических аннотаций веб-документов - page 6

рах
,
определяет новый класс формальных объектов
,
называемых кон
-
цептуальными базисами
(
к
.
б
.).
Каждый к
.
б
.
строится для формализа
-
ции группы предметных областей и является сложным упорядоченным
набором
,
задающим а
)
множество первичных информационных единиц
и множество переменных
,
используемых для построения формул
,
ин
-
терпретируемых как СП ЕЯ
-
текстов
,
б
)
сведения
,
относящиеся к таким
единицам и используемые для комбинирования этих единиц и несколь
-
ких специальных символов в составные единицы
СП ЕЯ
-
текстов
.
Модель для каждого к
.
б
.
B
задает множество формул
Ls
(
B
)
,
удоб
-
ных для построения СП ЕЯ
-
текстов
,
называемое стандартным К
-
язы
-
ком
(
концептуальным языком
),
или СК
-
языком
,
порождаемым базисом
B
.
Выражения СК
-
языков будут называться К
-
цепочками
.
Множество
Ls
(
B
)
для произвольного к
.
б
.
B
определяется совместной индукци
-
ей с помощью системы специальных правил
P
[0]
, P
[1]
, . . . , P
[10]
;
они
интер
-
претируются как правила построения семантических предста
-
влений
(
СП
)
ЕЯ
-
текстов из элементов первичного информационного
универсума
X
(
B
)
,
переменных из
V
(
B
)
и нескольких специальных
символов при условии
,
что
B
является концептуальным базисом для
рассматриваемой области
[9, 10].
Каждое из этих правил фактически задает некоторую операцию на
множестве всевозможных наборов
,
компоненты которых являются СП
простых или составных выражений естественного языка
(
ЕЯ
).
Имеют
-
ся веские основания предположить
,
что всего
10
операций достаточно
для построения формул
,
отображающих смысл
(
или структурирован
-
ные значения
)
сколь угодно сложных ЕЯ
-
текстов
.
Для любого к
.
б
.
B
правило
P
[0]
задает начальный запас формул
.
Пример
.
Можно построить такой к
.
б
.
B
,
что выполняются соотно
-
шения
чел
,
П
.
Сомов
,
НПО
_”
Радуга
”,
Друзья
,
Персонал
,
Поставщики
Ls(B).
Правило
P
[1]
предназначено для присоединения информационных
единиц
,
соответствующих словам
некоторый
”, “
каждый
” , “
какой
-
нибудь
”, “
все
”, “
несколько
”, “
большинство
” (
такие информационные
единицы в данной работе называются интенсиональными кванторами
)
к простым или составным обозначениям понятий
.
Поэтому правило
P
[1]
позволяет строить формальные аналоги выражений
: “
некоторый
человек
”, “
все люди
”, “
большинство людей
”, “
некоторый человек ро
-
стом
175
см
”, “
все тридцатилетние люди
”, “
все города Европы
”.
При
-
мерами
l
-
формул
(
К
-
цепочек
)
для
P
[1]
,
как последнего примененного
правила
,
являются цепочки
нек чел
,
все чел
(
Возраст
, <30,
год
>),
все
город
*(
Регион
,
Европа
) .
Правило
P
[2]
предназначено для построе
-
ния цепочек вида
f
(
a
1
, . . . , a
n
)
,
где
f
обозначение функции
,
n
1
,
a
1
, . . . , a
n
l
-
формулы
,
построенные с применением каких
-
то правил
78 ISSN 0236-3933.
Вестник МГТУ им
.
Н
.
Э
.
Баумана
.
Сер
. “
Приборостроение
”. 2005.
3
1,2,3,4,5 7,8,9,10,11,12,13,14
Powered by FlippingBook