Метод обучения модели извлечения знанийиз естественно-языковых текстов - page 12

(

, T

)

< θ

. Такой подход позволяет существенно ограничить чи-

сло проверок покрытий правилом

. Так, если при проверке число

покрытий правилом превысило значение

(

, T

)

(

, T

)

(9)

то правило можно дальше не проверять и принять его качество

(

, T

) = 0

. Выигрыш от такого подхода возможен, так как для

расчета

(

, T

)

достаточно использовать только часть всей обучаю-

щей выборки

, состоящую из позитивных примеров для текущего

слота, тогда как для расчета

(

, T

)

в общем случае требуется опре-

делять покрытия по всей

Алгоритм обобщения пары правил Generalize

(

, v

)

использует-

ся при итеративном обобщении в выражениях (8). Пусть правила

представлены в виде троек образцов:

◦

. Обобщение выполняется независимо для каждой

пары образцов

(

, p

)

(

, p

)

(

, p

)

. Результатом обобщения

каждой такой пары являются множества префиксных (

), извлека-

ющих (

) и постфиксных (

) обобщенных образцов. Для каждой

тройки

(

, p

)

∈

формируется правило

◦

если

удовлетворяет критерию (9), то выполняется расчет его качества

(6). Из всех возможных троек

◦

выбирается единственное

правило

с максимальным качеством

(

, T

)

При обобщении пары образцов

(

, p

)

независимо от их типа (пре-

фиксный, постфиксный или извлекающий) выполняется построение

матрицы соответствий

(рис. 2), в которой со строками связаны эле-

менты образца

◦

. . .

◦

, а со столбцами — элементы образца

◦

. . .

◦

. Таким образом, размер матрицы составляет

Матрица заполняется следующим образом. Для любой пары эле-

ментов

< c

∅

, l

< c

∅

, l

, при использовании

операции наименьшей верхней границы решетки лексических огра-

ничений, формируется наименьшее общее лексическое ограничение

∨

. Для него определяется величина

= 1

−

∈

(

)

, зна-

чение которой записывается в соответствующую ячейку матрицы, где

Рис. 2. Матрица соответствий образцов

86 ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2007. № 3

SEO Version

Warning.

You are currently viewing the SEO version of !text.
It has a number of design and functionality limitations.

We recommend viewing the Flash version or the basic HTML version of this publication.

1...,2,3,4,5,6,7,8,9,10,11 13,14,15,16,17,18,19