Методика автоматизированной расшифровки знаменных песнопений - page 9

Рис. 5. Фрагмент
n
-граммной модели
В этом случае множество триграмм можно представить как
T rZ
(
r
) =
ϕ
5
(
RZ,r
) =
{h
z
i
, z
i
+1
, z
i
+2
i}
,
где
z
2
RZ
(
r
)
.
Комбинированный метод.
В рамках этого метода словарь, по-
строенный на основе изучения попевок, и словарь, полученный с по-
мощью статистического машинного перевода, объединяют. При этом
пользователю необходимо расставить приоритеты правил так, чтобы
в первую очередь применялись правила, которые задал эксперт, за-
тем правила из попевок и правила, полученные из статистического
перевода
N
-грамм.
Составление общего словаря
SL
можно представить процедурой
ϕ
6
, объединяющей другие словари
sl
i
:
SL
=
ϕ
6
s
[
i
=1
sl
i
.
В рамках исследования рукописи эксперт может построить частот-
ные двоезнаменники и провести анализ всех правил, в которые входит
конкретное знамя. В результате исследования эксперт может выявить
закономерности и составить новые правила, отредактировать или ис-
ключить какое-либо правило. Под редактированием понимается из-
менение вероятности или приоритета правила, а также входящих в
правило знамен и нот [19].
Преобразование (дешифровка) рукописи с помощью словаря.
На этом этапе методики осуществляется перевод рукописи с помо-
щью составленного на предыдущем этапе словаря. Выбор подходящих
правил для триграммы:
8
T rZ
i
2
T rZ
:
P rT rz
=
ϕ
7
(
T rZ, S
) =
{
P r
1
, P r
2
, . . . , P r
p
}
,
где
p
— число правил, подходящих для перевода.
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2014. № 4 63
1,2,3,4,5,6,7,8 10,11,12,13,14,15
Powered by FlippingBook