Предсказание атрибутов профиля пользователя социальной сети…
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2017. № 2
71
ства атрибутов, представляющих собой предполагаемый профиль центральной
вершины. Для каждого из графов выборок и метода предсказания был выбран
порог с наибольшим значением меры
1
.
F
Результаты
предсказания профилей с использованием всех атрибутов
представлены в табл. 2. Значения меры
1
F
оказались очень низкими для всех
методов. Стоит отметить, что несмотря на это предложенный алгоритм все рав-
но дает приемлемые результаты для выборки Facebook.
Таблица 2
Средние значения меры
F
1
предсказания профилей с использованием всех атрибутов
Метод предсказания
с использованием всех атрибутов
Социальная сеть
ВКонтакте
Простое большинство
0,46
0,16
0,06
Эталонные сообщества
0,52
0,19
Нет данных
Infomap
0,49
0,18
0,17
Modularily Max.
0,53
0,19
0,15
AGM-fit
0,52
0,19
0,19
BigCLAM
0,57
0,23
0,26
CESNA
0,54
0,22
0,22
CESNA (веса)
0,31
0,19
0,23
Предлагаемый метод
0,60
0,27
0,32
Множества атрибутов были отфильтрованы: атрибуты, которые невоз-
можно предсказать, были отброшены. Для набора данных Facebook были остав-
лены такие атрибуты, как сведения об образовании пользователя (высшем и
среднем) и его родном городе. Для выборки графов из сети Twitter были выбра-
ны 100 самых популярных хэштегов во всей выборке, число которых было сни-
жено до 86 после ручной проверки. Для набора данных из сети ВКонтакте были
оставлены сведения о среднем и высшем образовании и месте работы. Результа-
ты для выборок только c предсказываемыми атрибутами приведены в табл. 3.
Таблица 3
Средние значения меры
F
1
предсказания профилей с использованием
предсказываемых атрибутов
Метод предсказания с использова-
нием предсказываемых атрибутов
Социальная сеть
ВКонтакте
Простое большинство
0,77
0,64
0,42
Эталонные сообщества
0,76
0,76
Нет данных
Infomap
0,73
0,64
0,56
Modularily Max.
0,79
0,68
0,58
AGM-fit
0,78
0,67
0,62
BigCLAM
0,86
0,72
0,73
CESNA
0,84
0,72
0,68
CESNA (веса)
0,47
0,75
0,77
Предлагаемый метод
0,84
0,87
0,86