66
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2017. № 2
УДК 004.056:519.178:51-74
DOI: 10.18698/0236-3933-2017-2-66-76
ПРЕДСКАЗАНИЕ АТРИБУТОВ ПРОФИЛЯ ПОЛЬЗОВАТЕЛЯ
СОЦИАЛЬНОЙ СЕТИ ПУТЕМ АНАЛИЗА СООБЩЕСТВ ГРАФА
ЕГО БЛИЖАЙШЕГО ОКРУЖЕНИЯ
В.О. Чесноков
v.o.chesnokov@yandex.ruМГТУ им. Н.Э. Баумана, Москва, Российская Федерация
Аннотация
Ключевые слова
Определение скрытых атрибутов пользователя он-
лайновых социальных сетей — одна из важнейших
проблем анализа социальных данных. Предложен
подход к определению неуказанных или скрытых
атрибутов пользователя путем анализа структуры
графа его ближайшего окружения и атрибутов вер-
шин этого графа. Выполнено сравнение предлагаемо-
го метода с другими методами на выборках графов
ближайшего окружения пользователей из социаль-
ных сетей Facebook, Twitter и ВКонтакте. Алгоритм
показал высокие значения
F
-меры, точности и полно-
ты по предсказыванию отдельных атрибутов профиля
таких, как родной город или место обучения пользо-
вателя. Использование предлагаемого алгоритма с
дополнительными источниками информации позво-
лит с высокой точностью раскрыть личность ано-
нимного пользователя социальной сети по его связям
с другими пользователями
Cоциальные сети, социальный
граф, выделение сообществ,
предсказание профилей
Поступила в редакцию 06.06.2016
©МГТУ им. Н.Э. Баумана, 2017
Работа выполнена при поддержке гранта РФФИ № 16-29-09517 офи_м «Методы и
алгоритмы выявления сообществ и организации информационного противоборства
в социальных сетях на основе байесовских и теоретико-игровых подходов с использова-
нием графовых и фрактальных моделей»
Введение.
Одной из важнейших особенностей социальных сетей является тот
факт, что у каждой вершины есть набор атрибутов, характеризующих ее. Это
могут быть как демографические характеристики (пол, возраст, образование и
др.), так и сведения об интересах личности: любимые фильмы, увлечения, поли-
тические предпочтения и т. д. Данные атрибуты имеют важное значение при
анализе общественного мнения, разработке рекомендательных систем, таргети-
рованной рекламы.
Однако в реальных сетях полная информация об атрибутах пользователя
зачастую бывает недоступна из-за разных причин: настройки приватности, по-
тери данных при передаче и др. В связи с этим возникает задача предсказания
отсутствующих или неуказанных атрибутов пользователя.