Выявление аномалий при прогнозном анализе данных
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2016. № 5
81
Рис. 2.
Зависимость показателя локальной аномальности объектов ядра
rel
LOF S
при
k =
5 (
а
), 10 (
б
), 2 (
в
) и 4 (
г
)
от точек ядра к относительной площади фигуры ядра. Анализ проведен для раз-
личных значений параметра
k
. Пример зависимости приведен на рис. 2, допол-
нительные зависимости — в работе [11]. Результаты анализа атрибутов пред-
ставлены в таблице.
Результаты анализа атрибутов
k
Показатель
LOF
Разброс точек ядра
LOF
Число выбросов
5
1,003
0,056
9
10
0,999
0,035
4
2
1,000
0,033
4
4
1,001
0,078
2
Для каждой зависимости эксперт определяет некоторую точку
Х
, в которой
начинается возрастание функции, показатель
LOF
ядра в точке
Х
, а также раз-
брос
LOF
точек ядра. Точки, не вошедшие в ядро в точке
X
, считались выбро-
сами при данном значении
k
. Результаты экспериментов подтверждают, что при
увеличении параметра
k
зависимость среднего показателя локальной аномаль-
ности объектов ядра от относительной площади фигуры ядра становится более
пологой, сигнал о появлении выбросов появляется позднее, т. е. большее число
объектов попадает в ядро и меньше точек идентифицируются как выбросы. Та-
ким образом, параметр
k
можно рассматривать как «регулятор» степени жест-
кости идентификации выбросов. Чем выше значение параметра
k
, тем «мягче»
анализ и меньше объектов будут отнесены к выбросам.