рую можно рассматривать как некоторый текст на неизвестном языке
,
приспособленном для описания обрабатываемых кривых
,
а каждую
цепочку
—
как некоторую фразу
(
или несколько фраз
)
на этом языке
.
В общем виде задача формирования грамматики формулируется
следующим образом
.
Задано некоторое количество текстов в виде множества упорядочен
-
ных последовательностей символов
.
Требуется
,
во
-
первых
,
сформиро
-
вать алфавит более крупных лингвистических единиц
,
чем отдельные
символы
,
т
.
е
.
словарь слов
(
структурных комплексов
),
каждое из кото
-
рых является устойчивой цепочкой символов
,
и
,
во
-
вторых
,
предста
-
вить каждый из заданных текстов в виде одного или нескольких слов
этого словаря
.
Предположим
,
что имеется один достаточно длинный текст
T
=
h
c
1
. . . c
N
i
,
где
c
1
. . . c
N
—
упорядоченная последовательность
его символов
.
Всякое разбиение
D
текста
Т
на непересекающиеся
отрезки задает некоторый словарь
M
.
Формирование словаря можно
понимать как выделение набора
“
основных макрособытий
”
в развитии
исследуемого процесса
.
Эти макрособытия отражены в символическом
представлении кривых в виде стабильных цепочек символов
.
Пусть сформирован словарь
М
.
Обозначим через
L
множество всех
конечных цепочек символов из алфавита
A
.
Рассмотрим подмножество
ˆ
L
(
M
)
⊂
L
всех таких цепочек
,
каждая из которых представляет собой
последовательность слов из словаря
М
.
Подмножество цепочек
ˆ
L
(
M
)
является языком
,
полностью определяемым словарем
М
.
Цепочка
Т
принадлежит языку
ˆ
L
(
M
)
(
является его правильной цепочкой
)
тогда и
только тогда
,
когда существует такое ее разбиение
D
,
что образ каждого
отрезка из
D
есть в точности слово из
М
.
При этом всякое слово также
является правильной цепочкой языка
ˆ
L
(
M
)
.
Язык
,
в котором любая последовательность слов из словаря
М
явля
-
ется правильной цепочкой
,
назовем языком с морфологической грам
-
матикой
.
Для того чтобы морфологическую грамматику можно было
использовать для анализа текстов
(
экспериментальных кривых
),
необ
-
ходимо иметь процедуру преобразования символьного текста в упоря
-
доченный набор слов
,
т
.
е
.
процедуру распознавания правильности это
-
го текста в языке
ˆ
L
(
M
)
.
Поскольку сейсмический сигнал носит случайный характер и сме
-
на состояний процесса не имеет логической закономерности
,
то не
-
льзя дать точного описания экспериментальным кривым
.
Морфологи
-
ческую грамматику следует рассматривать лишь как модель
,
более или
менее точно аппроксимирующую тексты
,
порождаемые эксперимен
-
тальной кривой
.
Чтобы ее использовать
,
необходимо дополнить меха
-
102 ISSN 0236-3933.
Вестник МГТУ им
.
Н
.
Э
.
Баумана
.
Сер
. "
Приборостроение
". 2004.
№
3