В.И. Аникин, О.В. Аникина, О.М. Гущина
118
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2017. № 5
Недостатком этого приближения является то, что сглаживание контроли-
руется одним общим, задаваемым пользователем параметром λ, что может вы-
звать некоторые затруднения, когда данные содержат как быстро, так и медлен-
но осциллирующие участки.
Эффективное решение уравнения (3) табличными средствами невозможно,
так как для этого к матрице
X
(
X
т
X
+
D
)
−1
X
т
y
необходимо применить сингуляр-
ное разложение [7], встроенная поддержка которого в
Microsoft Excel
отсутству-
ет. Отметим, что работа [7] содержит работоспособный программный код
R алгоритма решения уравнения (3), который можно использовать для сравне-
ния полученных здесь результатов с результатами выполнения этого кода.
Вместо векторно-матричного решения уравнения (3) для нахождения
функции регрессии
ŷ
(
x
) авторами настоящей работы в
Microsoft Excel
решена
оптимизационная задача:
минимизировать целевую функцию
2
2
0
1
ˆ
,
n
K
i
i
pk
i
i
F
y y
(4)
где
y
— случайная выборка данных;
ŷ
— P-сплайн с усеченным полиномиаль-
ным базисом
p
-го порядка.
При решении этой задачи возникает проблема подбора наилучшего значе-
ния сглаживающего параметра
. Необходимость оптимизации обусловлена
тем, что при
= 0 сглаживание отсутствует (переобученная модель), а при
больших значениях
оно слишком велико (линия регрессии игнорирует быст-
рые средние локальные изменения в данных).
Существует несколько автоматических методов решения этой проблемы.
1. Оптимизация параметра
по одному из критериев [7]:
−
перекрестной проверки (
cross-validation
)
CV
(
);
−
обобщенной перекрестной проверки
GCV
(
);
−
информационному критерию Акаике (
Akaike
)
AIC
(
);
−
скорректированному критерию Акаике
AIC
C
(
).
2.
Оптимизация параметра
по критерию максимального правдоподо-
бия:
best
=
/
[4], где
— несмещенное стандартное отклонение вектора
остатков
y
−
ŷ
;
— стандартное отклонение значений параметров
1
,
]
[
,
m
p
p
pK
полиномиального P-сплайна.
Одним из недостатков табличной реализации в
Microsoft Excel
полиномиаль-
ных P-сплайнов является громоздкость получаемой электронной таблицы, обу-
словленная необходимостью расчета в отдельных ячейках
N
общ
= (
K + p +
1)(
n
+ 1)
значений базисных функций сплайна.
Однако для полиномиальных P-сплайнов существует возможность строить
рекурсивные табличные модели, объем эквивалентных вычислений в которых
сокращается до пересчета
N
рек
= (
p
+ 1)(
n
+ 1) ячеек, т. е. более чем на порядок