Previous Page  5 / 18 Next Page
Information
Show Menu
Previous Page 5 / 18 Next Page
Page Background

В.И. Аникин, О.В. Аникина, О.М. Гущина

118

ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2017. № 5

Недостатком этого приближения является то, что сглаживание контроли-

руется одним общим, задаваемым пользователем параметром λ, что может вы-

звать некоторые затруднения, когда данные содержат как быстро, так и медлен-

но осциллирующие участки.

Эффективное решение уравнения (3) табличными средствами невозможно,

так как для этого к матрице

X

(

X

т

X

+

D

)

−1

X

т

y

необходимо применить сингуляр-

ное разложение [7], встроенная поддержка которого в

Microsoft Excel

отсутству-

ет. Отметим, что работа [7] содержит работоспособный программный код

R алгоритма решения уравнения (3), который можно использовать для сравне-

ния полученных здесь результатов с результатами выполнения этого кода.

Вместо векторно-матричного решения уравнения (3) для нахождения

функции регрессии

ŷ

(

x

) авторами настоящей работы в

Microsoft Excel

решена

оптимизационная задача:

минимизировать целевую функцию

2

2

0

1

ˆ

,

n

K

i

i

pk

i

i

F

    

y y

(4)

где

y

— случайная выборка данных;

ŷ

— P-сплайн с усеченным полиномиаль-

ным базисом

p

-го порядка.

При решении этой задачи возникает проблема подбора наилучшего значе-

ния сглаживающего параметра

. Необходимость оптимизации обусловлена

тем, что при

= 0 сглаживание отсутствует (переобученная модель), а при

больших значениях

оно слишком велико (линия регрессии игнорирует быст-

рые средние локальные изменения в данных).

Существует несколько автоматических методов решения этой проблемы.

1. Оптимизация параметра

по одному из критериев [7]:

перекрестной проверки (

cross-validation

)

CV

(

);

обобщенной перекрестной проверки

GCV

(

);

информационному критерию Акаике (

Akaike

)

AIC

(

);

скорректированному критерию Акаике

AIC

C

(

).

2.

Оптимизация параметра

по критерию максимального правдоподо-

бия:

best

=

/

[4], где

— несмещенное стандартное отклонение вектора

остатков

y

ŷ

;

— стандартное отклонение значений параметров

1

,

]

[

,

m

p

p

pK

   

полиномиального P-сплайна.

Одним из недостатков табличной реализации в

Microsoft Excel

полиномиаль-

ных P-сплайнов является громоздкость получаемой электронной таблицы, обу-

словленная необходимостью расчета в отдельных ячейках

N

общ

= (

K + p +

1)(

n

+ 1)

значений базисных функций сплайна.

Однако для полиномиальных P-сплайнов существует возможность строить

рекурсивные табличные модели, объем эквивалентных вычислений в которых

сокращается до пересчета

N

рек

= (

p

+ 1)(

n

+ 1) ячеек, т. е. более чем на порядок