Previous Page  4 / 18 Next Page
Information
Show Menu
Previous Page 4 / 18 Next Page
Page Background

Парная регрессия в

Microsoft Excel

с использованием Р-сплайнов

ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2017. № 5

117

чтобы он лучше подходил под искомые данные. Нетрудно понять, что варьиро-

вание числа узлов P-сплайна равносильно добавлению к регрессионной модели

большего числа предсказывающих переменных. К сожалению, можно добавить

слишком много узлов и «переобучить» модель, тем самым подчеркивая в дан-

ных случайные флуктуации, которые несущественны.

Для того чтобы избежать «переобучения», на величины весов

p

1

,

p

2

, …,

pK

базисных функций накладываются ограничения (штрафы). Существует не-

сколько критериев штрафования, из них простейшим и одним из лучших явля-

ется критерий

2

1

,

K

pk

i

C

 

где

C

— некоторая константа.

Представленные соображения можно сформулировать математически в

векторно-матричном виде, для чего определим вектор

y

т

= [

y

0

, …,

y

n

], а также

матрицы

X

и

D

вида

0

0 1

0

0

1

....................................................................

1

;

1

......

p

p

p

K

p

p

p

n

n

n

n K

x x

x

x

x x

x

x

    

 

    

X

0 0 0 0 0

0 0 0 0 0

0 0 1 0 0

.

0 0 0 1 0

0 0

...

0

......

0

.......

1

..........

 

 

 

 

 

 

D

Тогда для заданного сглаживающего параметра

оценка вектора неизвестных

параметров

регрессионной модели, где

т

= [

0

,

1

,

p

1

, …,

pK

], может быть по-

лучена путем минимизации целевой функции

2

т

.

F

   

y X

D

  

(2)

Дифференцируя выражение (2) по

и приравнивая производную нулю, по-

лучаем

т

0,

  

D X y X

 

*

*

откуда

1

*

т

т

;

 

X X D X y

1

т

т

λ

ˆ

.

y X X X D X y

(3)