Previous Page  4 / 11 Next Page
Information
Show Menu
Previous Page 4 / 11 Next Page
Page Background

Предсказание атрибутов профиля пользователя социальной сети…

ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2017. № 2

69

+

α

,

,

|

| |

| > max(2, |

|)

:= { },

v a

v a

v

v

v

Q

K K a

где

α

— доля, определяющая большинство для атрибута;

∈ ∧ ∈

= { |

{ , } };

v

n n V n v E

∈ ∧ ∈

,

= { |

( )};

v a

v

u u

a f u

,

= { |

}.

v a

v

u

Q u u

a K

∈ ∧ ∈

Итерации прекращаются, когда на последнем шаге не было произведено ни

одного изменения.

Затем вершины объединяются в сообщества по атрибутам из множества

ключевых:

= { |

},

a

v

C v a K

т. е. каждому атрибуту ставится в соответствие множество вершин, у которых

этот атрибут имеется в множестве ключевых атрибутов. Каждое из сообществ

разбивается на компонентны связности, и тривиальные компоненты из одной

или двух вершин отбрасываются. Наконец, сообщества, множества вершин ко-

торых совпадают, объединяются в одно, которому сопоставляется набор атри-

бутов всех сообществ. Таким образом, результатом работы алгоритма является

список сообществ

, каждому из которых поставлен в соответствие один или

несколько атрибутов:

= {( , ) |

,

}.

A C A F C V

⊆ ⊆

Поскольку центральная вершина состоит во всех сообществах графа ее

ближайшего окружения, то она, скорее всего, будет иметь все атрибуты, связан-

ные с этими сообществами. Предлагаемый метод предсказания профиля

p

цен-

тральной вершины заключается в объединении всех атрибутов сообществ, по-

лученных алгоритмом:

( , )

=

.

A C

p

A

Таким образом, данный метод объединяет два распространенных подхода к

решению проблемы: выделение сообществ и перенос атрибутов. В работе [10]

особое внимание уделено выделению сообществ в условиях, когда часть инфор-

мации об атрибутах вершин недоступна, поэтому можно утверждать, что пред-

ложенный подход, основанный на данном алгоритме, также будет толерантен к

частичному отсутствию атрибутов вершин.

Как показали эксперименты, не все атрибуты профиля могут быть предска-

заны на основе информации о структуре графа и атрибутах вершин. Примером

таких атрибутов может служить имя пользователя или пол. Поэтому перед

применением алгоритма необходимо отбросить те атрибуты, которые невоз-

можно предсказать.

Метод оценки качества предсказания.

Точность предсказания предложен-

ного метода была сравнена с несколькими известными подходами, использую-

щими информацию о связях и атрибутах пользователей. В сравнении не рас-