Методика автоматизированной расшифровки знаменных песнопений - page 8

Построение словаря на основе попевок.

За основу берутся попев-

ки. Предварительно подготовленный сборник попевок образует сово-

купность правил, каждому из которых ставится в соответствие перевод

на основе двоезнаменника или азбук:

(

) =

(

RZ, r

) =

, z

, n

, p

}

В целях обеспечения независимости перевода от начального звука

и проверки гипотезы аналогичности перевода для попевок в разных

гласах необходимо сохранить интервальную последовательность для

каждой попевки. Такой код представляет собой обозначение не кон-

кретной ноты, а число полутонов (интервал), на которые отличается

текущий звук от предыдущего. Преобразование нотного словаря в ин-

тервальный можно представить следующим образом:

ISl

(

) =

, z

Intr

, Intr

, p

}

Первоначально при автоматическом построении словаря предлага-

ется задавать приоритет правила. Это обусловлено тем, что сначала

следует применять самые длинные правила, а затем — более короткие.

В процессе исследования эксперт может отредактировать значения

приоритетов, изменив их на те, которые полагает более правильными.

Построение словаря на основе двоезнаменника.

За основу берет-

ся двоезнаменник, который представляет собой корпус параллельных

песнопений (записанных в двух нотациях). Это дает возможность по-

строения

-граммной модели перевода. В результате анализа двоезна-

менника формируется словарь, аналогичный словарю, созданному на

основе попевок. В этом случае словарь будет состоять из

-грамм

(

= 1

). Вероятность таких правил может быть рассчитана как

произведение вероятности входящих в него

-грамм.

В рамках базовой функциональности разработываемых инструмен-

тов выбрана размерность

-грамм, равная трем. Для каждой триграм-

мы ставятся в соответствие ноты, которыми переводятся знамена, вхо-

дящие в триграмму, а также вероятность встречаемости триграммы

(рис. 5).

Вероятность каждого правила вычисляется согласно правилам по-

строения модели перевода в статистическом машинном переводе: рас-

считывается вероятность

(

)

для каждой пары

< n, z >

(

— по-

следовательность знамен;

— перевод этой последовательности). Ве-

роятность определяется по формуле

(

) =

(

n, z

)

(

)

где

(

n, z

)

— число раз, когда последовательность знамен

перево-

дится нотами

62 ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2014. № 4

SEO Version

Warning.

You are currently viewing the SEO version of !text.
It has a number of design and functionality limitations.

We recommend viewing the Flash version or the basic HTML version of this publication.

1,2,3,4,5,6,7 9,10,11,12,13,14,15