могут применяться при мониторинге потоков новостей для извлечения
конкретных данных по интересующим нас событиям (место, где со-
бытие происходит, участники события и др.). Другой областью приме-
нения обученных моделей является наполнение тезаурусов и онтоло-
гий, когда в качестве источника знаний выступают репрезентативные
естественно-языковые тексты предметной области.
В настоящий момент разработанный метод и обученные модели
используются в системе семантического контроля текстов редакти-
руемых документов для поиска несоответствий в текстах стенограмм
заседаний Совета Федерации Федерального Собрания РФ. Кроме того,
эта же технология используется в интеллектуальной системе выявле-
ния и исправления ошибок в почтовых адресах клиентов банка.
СПИСОК ЛИТЕРАТУРЫ
1. J o r d i T u r m o , A l i c i a A g e n o , N e u s C a t a l a . Adaptive
information extraction // ACM Computing Surveys. – Vol. 38, No 2.
2. M a r y C a l i f f , R a y m o n d J. M o o n y . Bottom-up relational learning
of matching rules for information extraction // Journal of Machine Learning Research
4, 2003.
3. H e r v e D e j e a n . Learning rules and their exceptions // Journal of Machine
Learning Research 2, 2002.
4. V i n c e n t C l a v e a u e , P a s c a l e S e b i l l o t . Learning semantic
lexicons from a part-of-speech and semantically tagged corpus using inductive logic
programming // Journal of Machine Learning Research 4, 2003.
5. S c o t t B. H u f f m a n .
Learning to extract information from text based on
user-provided examples, ACM, 1996.
6. J u n - T a e K i m , D a n I. Moldovan, PALKA: a system for lexical knowledge
acquisition. ACM’1993.
7. T e d P e d e r s e n . A simple approach to building ensembles of naive bayesian
classifiers for word sense disambiguation. ACM.
8. V i n a y a k B o r k a r , S u n i t a S a r a w a h i . Automatic segmentation
of text into structured records. ACM, 2001.
9. А н д р е е в А. М., Б е р е з к и н Д. В., С и м а к о в К. В. Особенно-
сти проектирования модели и онтологии предметной области для поиска про-
тиворечий в правовых электронных библиотеках // VI Всерос. научн. конф.
RCDL’2004.
10. А н д р е е в А. М., Б е р е з к и н Д. В., Р ы м а р ь В. С. Исп ользование
технологии Semantic Web в системе поиска несоответствий в текстах докумен-
тов // VIII Всерос. научн. конф. RCDL’2006.
11. А н д р е е в А. М., Б е р е з к и н Д. В., С и м а к о в К. В. Модель из-
влечения фактов из естественно-языковых текстов и метод ее обучения // VIII
Всерос. научн. конф. RCDL’2006.
12. U d o H a h n ,
K o r n e l G. M a r k o .
Joint knowledge capture for
grammars and ontologies. ACM’2001.
13. Г а в р и л о в а Т. А., Ч е р в и н с к а я К. Р. Извлечение и структурирование
знаний для экспертных систем. – М.: Радио и связь, 1992.
14. U d o H a h n . Knowledge mining from textual sources. ACM’1997.
15. G e o r g e A.
M i l l e r .
WordNet: A lexical database for English //
Communications of the ACM, Vol. 38, No 11, 1995.
92 ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2007. № 3