В.И. Аникин, О.В. Аникина, О.М. Гущина
116
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2017. № 5
стой код
VBA
, использованный в табличных моделях, предназначен исключи-
тельно для автоматизации работы пользователя и без него можно обойтись).
Созданные табличные модели P-сплайновой регрессии на основе усеченных по-
линомов первого, второго и третьего порядков, особенно рекурсивные модели,
отличаются впечатляющей простотой и высоким качеством сглаживания.
P-сплайны и метод наименьших квадратов.
В литературе различают два
класса нелинейных регрессий:
1)
регрессии, нелинейные относительно включенных в анализ объясняю-
щих переменных, но линейные по оцениваемым параметрам;
2)
регрессии, нелинейные по оцениваемым параметрам.
Здесь рассмотрены нелинейные регрессии первого класса, что позволяет
при нахождении параметров уравнения регрессии эффективно использовать
метод наименьших квадратов (МНК) [5, 6]. Известно, что этот метод нашел ши-
рокое практическое применение в самых различных задачах оптимизации ввиду
уникальных статистических свойств: несмещенности, состоятельности и эффек-
тивности оценки неизвестных линейных параметров.
Идея P-сплайнов довольно простая. Гладкая неизвестная функция регрес-
сии аппроксимируется функциональной параметрической формой, образован-
ной набором базисных функций большой размерности. Размерность базиса вы-
бирается так, чтобы достигалась достаточная гибкость аппроксимации, тогда
как коэффициенты базисных функций штрафуются, обеспечивая желаемую
гладкость результирующего функционала.
Пусть имеется
n
+1 пар точек (
x
i
,
y
i
), удовлетворяющих модели
y
i
=
ŷ
(
x
i
)+
i
,
где
i
= 0,…,
n
;
ŷ
(
x
) — неизвестная функция регрессии;
i
— независимые случай-
ные добавки с нулевым средним значением и постоянной дисперсией
2
. Моде-
лируем функцию
ŷ
(
x
) P-сплайном степени
p
с усеченным полиномиальным ба-
зисом:
0 1
1
ˆ
...
,
K
p
p
p
pk
k
k
y x
x
x
x
где
при
;
0
при
;
p
p
k
k
k
k
x
x
x
x
pk
— вес кусочных функций (
x −
k
)
p
+
;
k
— фиксированные координаты узлов
P-сплайна.
Как правило, степень полинома, число и положение узлов P-сплайна мало
влияют на точность оценки функции регрессии, и можно использовать от 35 до
40 равномерно отстоящих друг от друга узлов для большинства случайных вы-
борок данных и всех гладких функций, не содержащих большого числа осцил-
ляций [4].
Если по каким-либо причинам этот выбор не устраивает, то, определяя но-
вые узлы или сдвигая существующие, P-сплайн можно легко модифицировать,