1 / 11 Next Page
Information
Show Menu
1 / 11 Next Page
Page Background

66

ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2017. № 2

УДК 004.056:519.178:51-74

DOI: 10.18698/0236-3933-2017-2-66-76

ПРЕДСКАЗАНИЕ АТРИБУТОВ ПРОФИЛЯ ПОЛЬЗОВАТЕЛЯ

СОЦИАЛЬНОЙ СЕТИ ПУТЕМ АНАЛИЗА СООБЩЕСТВ ГРАФА

ЕГО БЛИЖАЙШЕГО ОКРУЖЕНИЯ

В.О. Чесноков

v.o.chesnokov@yandex.ru

МГТУ им. Н.Э. Баумана, Москва, Российская Федерация

Аннотация

Ключевые слова

Определение скрытых атрибутов пользователя он-

лайновых социальных сетей — одна из важнейших

проблем анализа социальных данных. Предложен

подход к определению неуказанных или скрытых

атрибутов пользователя путем анализа структуры

графа его ближайшего окружения и атрибутов вер-

шин этого графа. Выполнено сравнение предлагаемо-

го метода с другими методами на выборках графов

ближайшего окружения пользователей из социаль-

ных сетей Facebook, Twitter и ВКонтакте. Алгоритм

показал высокие значения

F

-меры, точности и полно-

ты по предсказыванию отдельных атрибутов профиля

таких, как родной город или место обучения пользо-

вателя. Использование предлагаемого алгоритма с

дополнительными источниками информации позво-

лит с высокой точностью раскрыть личность ано-

нимного пользователя социальной сети по его связям

с другими пользователями

Cоциальные сети, социальный

граф, выделение сообществ,

предсказание профилей

Поступила в редакцию 06.06.2016

©МГТУ им. Н.Э. Баумана, 2017

Работа выполнена при поддержке гранта РФФИ № 16-29-09517 офи_м «Методы и

алгоритмы выявления сообществ и организации информационного противоборства

в социальных сетях на основе байесовских и теоретико-игровых подходов с использова-

нием графовых и фрактальных моделей»

Введение.

Одной из важнейших особенностей социальных сетей является тот

факт, что у каждой вершины есть набор атрибутов, характеризующих ее. Это

могут быть как демографические характеристики (пол, возраст, образование и

др.), так и сведения об интересах личности: любимые фильмы, увлечения, поли-

тические предпочтения и т. д. Данные атрибуты имеют важное значение при

анализе общественного мнения, разработке рекомендательных систем, таргети-

рованной рекламы.

Однако в реальных сетях полная информация об атрибутах пользователя

зачастую бывает недоступна из-за разных причин: настройки приватности, по-

тери данных при передаче и др. В связи с этим возникает задача предсказания

отсутствующих или неуказанных атрибутов пользователя.