Парная регрессия в
Microsoft Excel
с использованием Р-сплайнов
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2017. № 5
117
чтобы он лучше подходил под искомые данные. Нетрудно понять, что варьиро-
вание числа узлов P-сплайна равносильно добавлению к регрессионной модели
большего числа предсказывающих переменных. К сожалению, можно добавить
слишком много узлов и «переобучить» модель, тем самым подчеркивая в дан-
ных случайные флуктуации, которые несущественны.
Для того чтобы избежать «переобучения», на величины весов
p
1
,
p
2
, …,
pK
базисных функций накладываются ограничения (штрафы). Существует не-
сколько критериев штрафования, из них простейшим и одним из лучших явля-
ется критерий
2
1
,
K
pk
i
C
где
C
— некоторая константа.
Представленные соображения можно сформулировать математически в
векторно-матричном виде, для чего определим вектор
y
т
= [
y
0
, …,
y
n
], а также
матрицы
X
и
D
вида
0
0 1
0
0
1
....................................................................
1
;
1
......
p
p
p
K
p
p
p
n
n
n
n K
x x
x
x
x x
x
x
X
0 0 0 0 0
0 0 0 0 0
0 0 1 0 0
.
0 0 0 1 0
0 0
...
0
......
0
.......
1
..........
D
Тогда для заданного сглаживающего параметра
оценка вектора неизвестных
параметров
регрессионной модели, где
т
= [
0
,
1
,
p
1
, …,
pK
], может быть по-
лучена путем минимизации целевой функции
2
т
.
F
y X
D
(2)
Дифференцируя выражение (2) по
и приравнивая производную нулю, по-
лучаем
т
0,
D X y X
*
*
откуда
1
*
т
т
;
X X D X y
1
т
т
λ
ˆ
.
y X X X D X y
(3)