Przykład analizy sieciowej z wykorzystaniem Gephi
Maciej Maryl

Dane sieciowe przygotowane w poprzednim punkcie, lub pozyskane z innych źródeł, można łatwo wizualizować i analizować w bezpłatnym programie Gephi. W tym podrozdziale dokonujemy krótkiej prezentacji zagadnienia, by pokazać łatwość obsługi i potencjał analityczny tego narzędzia, odsyłając zainteresowanych czytelników do bardziej szczegółowych opracowań.

Dane do programu można załadować w postaci tabelarycznej z pliku CSV lub XLS. Po obliczeniu podstawowych wartości węzłów (w tym wypadku – rang zależnych od liczby połączeń) możemy zwizualizować połączenia i zobaczyć, że D i B są kluczowymi elementami sieci, z którymi łączy się większość pozostałych elementów, w tym E. Możemy też skupić się w analizie tylko na relacjach wychodzących lub przychodzących.

Na poniższym grafie (il. 10) widzimy sieć stworzoną na podstawie listy węzłów z tab.1 i relacji między nimi z tab. 2. Kolor węzła oznacza płeć, zaś jego rozmiar –– rangę połączeń przychodzących (in-degree) danego węzła, czyli w tym wypadku liczbę cytowań danej osoby. Już na podstawie inspekcji wizualnej można stwierdzić, iż kluczowym punktem odniesienia w tej sieci jest Dawidowski, którego najczęściej cytuje Bogdanowski (rozmiar krawędzi), zaś Adamska jest najrzadziej cytowaną autorką.

Il. 9 Wizualizacja węzłów z tab. 1 i relacji między nimi z tab. 2

Il. 9 Wizualizacja węzłów z tab. 1 i relacji między nimi z tab. 2

Te wstępne obserwacje można pogłębiać na podstawie statystyk sieci, odmiennych algorytmów wizualizacyjnych, grupowania czy filtrowania węzłów i krawędzi pod wybranym kątem. Zagadnienia wykraczają poza ten wstępny ogląd, ale dobrym wprowadzeniem do problematyki analizy relacji sieciowych jest rozdział Grahama, Milligana i Weingerta 2016 i seria wpisów blogowych Weingarta (2011). Dobre wykazy podręczne terminów znajdują się u Duringa (2015), a Grandjean i Jacomy (2019) piszą, jak analizować duże sieci.

Spis treści