В.О. Чесноков
72
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2017. № 2
Для выборок, содержащих только предсказываемые атрибуты, значения
меры
1
F
для всех подходов значительно выше. Предложенный алгоритм дает
один из наилучших результатов для набора данных из сети Facebook и суще-
ственно превосходит другие подходы на выборках из сетей Twitter и ВКонтакте.
При этом полученные значения меры
1
F
довольно близки к единице.
Если сфокусироваться на отдельных атрибутах (табл. 4), то предложенный
алгоритм показывает результаты, очень близкие к единице. Таким образом,
данный алгоритм может быть использован для предсказания профилей с очень
высокой точностью.
Таблица 4
Результаты предсказания некоторых атрибутов профилей с использованием только
предсказываемых атрибутов
Социальная
сеть
Атрибут
Среднее значение
меры
1
F
точности
полноты
Образовательное
учреждение
0,902
0,967
0,875
Родной город
1,000
1,000
1,000
ВКонтакте
Средняя школа
0,919
0,910
0,973
Факультет (кафедра)
0,994
0,995
0,996
Место работы
0,994
0,997
0,994
Заключение.
В настоящей работе был предложен метод предсказания атрибу-
тов профиля пользователя социальной сети. Разработанный метод использует как
информацию о связях пользователя, так и сведения о его атрибутах. Он превосхо-
дит другие методы по мере
1
F
на выборках из трех социальных сетей и позволяет
предсказывать некоторые атрибуты профиля с точностью, близкой к единице.
Предложенный подход может быть использован для раскрытия личности
анонимных пользователей онлайновых социальных сетей. Например, если
пользователь имеет связи с другими пользователями, но при этом не указал о
себе никаких данных, в том числе ни имени, ни фотографии, то он считает, что
его личность не может быть раскрыта. Однако с использованием предложенно-
го алгоритма некоторые его атрибуты могут быть предсказаны с высокой точ-
ностью по связям в социальной сети. Очевидно, что большинство людей имеют
уникальную комбинацию этих атрибутов. Используя предсказанный профиль и
вспомогательные источники данных такие, как списки учащихся в образова-
тельном учреждении или телефонный справочник, аналитик может раскрыть
личность пользователя с высокой точностью.
ЛИТЕРАТУРА
1.
Davis C.A.J., Pappa G.L., de Oliveira D.R.R., de Zima А.F.
Inferring the location of twitter
messages based on user relationships // T. GIS. 2011. Vol. 15. No. 6. P. 735–751.
DOI: 10.1111/j.1467-9671.2011.01297.x
URL:
http://onlinelibrary.wiley.com/doi/10.1111/j.1467-9671.2011.01297.x/abstract