Модели и методы автоматической классификации текстовых документов - page 26

предложения должны получить приращение веса
);
в общем случае для
каждого индикативного выражения приращение веса имеет разные зна
-
чения
;
принадлежности термина к предложениям
,
входящим в различ
-
ные структурные части текста
.
Так
,
появление термина в структурной
части
выводы
более важно
,
чем в структурной части
введение
”.
Для
вычисления составляющей веса необходимо разбить текст на структур
-
ные составляющие
.
Каждая структурная составляющая в общем случае
содержит несколько групп связанных предложений
(
первое из них ав
-
тосемантичное
).
Учет всех указанных параметров выполняется согласно следующе
-
му алгоритму
.
Переменные
:
P
s
i
вес предложения
s
i
;
L
i
вероятность смысло
-
вой связи предложения
s
i
с предложением
s
i
1
.
1.
Для всех предложений полагается
P
s
i
= 1
,
L
i
= 0
.
2.
Для каждого предложения
s
i
выполняются шаги
3–5,
затем шаг
6.
3.
Сопоставляется текст предложения
s
i
с элементами словарей кон
-
некторов и индикаторов
,
величина
P
s
i
модифицируется согласно следу
-
ющей формуле
:
P
0
s
i
=
P
s
i
P
con
P
ind
,
(6)
где
P
con
среднее значение весов
(
важностей
)
всех коннекторов
,
со
-
поставленных с текстов предложения
(
данная величина равна единице
,
если ни один из коннекторов сопоставить не удалось
);
P
ind
то же для
индикаторов
(
данная величина равна единице
,
если ни один из индика
-
торов сопоставить не удалось
).
Важности коннекторов и индикаторов представляют собой числа в
диапазоне
0
,
5
. . .
1
,
определяемые на этапе создания соответствующих
словарей
.
4.
Если количество конннекторов
,
распознанных в предложении
s
i
,
не равно нулю
,
модифицируется
L
i
по формуле
L
0
i
= 1
(1
L
i
)
c
L
,
(7)
где
с
L
настроечный коэффициент
,
равный
0,4.
5.
Определяется количество и вид информативных терминов
,
одно
-
временно присутствующих в соседних предложениях
s
i
и
s
i
1
.
В слу
-
чае
,
когда количество больше или равно значению настроечного пара
-
метра
C
nl
,
величины
L
i
модифицируются в соответствии со следующей
формулой
:
L
00
i
= 1
(1
L
0
i
)
n
Y
i
=1
p
i
,
(8)
ISSN 0236-3933.
Вестник МГТУ им
.
Н
.
Э
.
Баумана
.
Сер
. “
Приборостроение
”. 2003.
4 89
1...,16,17,18,19,20,21,22,23,24,25 27,28,29,30,31
Powered by FlippingBook