صفحه نخست --> تحلیل شبکه های اجتماعی --> آموزش گفی (Gephi) نرم افزار تحلیل شبکه های اجتماعی و گراف کاوی

آموزش گفی (Gephi) نرم افزار تحلیل شبکه های اجتماعی و گراف کاوی

آموزش گفی

Gephi نرم افزاری محاوره ای که بر خلاف برخی از نرم افزارهای تحلیل شبکه های اجتماعی قابلیت نمایش شبکه اجتماعی همزمان با انجام تحلیل ها را دارد. الگوریتمهای مختلفی برای تحلیل و نمایش شبکه بر روی آن پیاده سازی شده و تعداد زیادی برنامه نویس بر روی آن در حال کار هستند. این برنامه امکان اضافه شدن قابلیتهایش را به صورت پلاگین(افزونه) دارد و قابلیتهای نمایش بصری آن به نسبت از بقیه نرم افزارهای موجود بهتر است و قادر به تحلیل و نمایش شبکه های ایستا و پویا است.

به طور خلاصه گفی یک ابزار بصری سازی برای سیستم عامل های Windows Mac OS X, Linux و به زبان برنامه نوسی جاوا (Java 1.7) و توسعه شده با فریم ورک Netbeans و دارای استاندارد متن باز  CDDL + GNU GPL 3 است. برای نحوه اضافه کردن یک پلاگین جدید به گفی، اینجا را کلیک کنید.

نکته: در صورتی که علاقمند به شرکت در دوره های آموزشی تحلیل شبکه های اجتماعی هستید، بر روی اینجا کلیک کنید.

نرم افزار گفی ابزاری مناسب برای تحلیلگران اطلاعات و دانشمندان مشتاق به کشف و درک گراف سیستم های پیچیده است. گفی نرم افزاری با قدرت رسم و تجسم سه بعدی از سیستم ها بر اساس داده های دریافتی است. ابزار قدرتمند گفی به کاربران امکان رسم و دستکاری ساختار، شکل و رنگ گراف ها را به منظور یافتن گراف بهینه و الگوهای پنهان می دهد. ابزارهای آماری این نرم افزار کمک شایانی به استخراج خواص آماری مختلف گراف ها می کند. همچنین الگوریتم های معروف تشخیص انجمن در این نرم افزار، امکان تعیین و آشکارسازی خوشه ها و جامعه های پنهان در دل گراف شبکه ها را به کاربران داده است.

Graph Mining gephi
Graph Mining gephi

  • گفی (Gephi) نرم افزاری برای تحلیل گراف شبکه های اجتماعی

گفی یک نرم افزار برای اکتشاف بصری شبکه ها می باشد( همچنین GRAPHS هم نامیده می شود). یک شبکه مجموعه ای از موجودیت هاست که نودها یا گره ها نامیده می شوند و مجموعه ای از ارتباطات میان گره ها است که یال ها نامیده می شوند. نرم افزارهای متنوعی برای بصری کردن و تجزیه و تحلیل شبکه ها وجود دارند، گفی مطالعه ویژه ای روی  شبکه ها با ویژگی گره ها  انجام می دهد. ویژگی ها جفت مقدار-کلیدی  از  رابطه هر گره یا هر یال است. برای مثال،افراد در شبکه های اجتماعی ویژگی هایی از قبیل جنسیت، زبان و سن را دارند.

کاربران گفی با بصری سازی در زمان واقعی (Realtime) با مستقرکردن گره ها در فضای دو یا سه بعدی با استفاده از الگوریتم های LAYOUT یا MOVE کردن گره ها بر هم تاثیر متقابل می گذارند. آنها از ویژگی گره ها برای تغییر رنگ و اندازه گره ها استفاده می کنند و  گروه ها و اشخاص را پیدا می کنند. هدف این تحلیل ها یافتن همبستگی ویژگی گره ها و ساختن شبکه با استفاده از الگوهای بصری است. طبقه بندی متریک های تحلیل شبکه های اجتماعی از قبیل درجه گره یا معیار مرکزی بینا بینی می تواند برای  محاسبه و بصری سازی بهتر استفاده شود. گراف شبکه می تواند براساس ویژگی ها نیز فیلتر شوند.

گفی
گفی

گفی محدودیتی در نوع گراف شبکه های اجتماعی ندارد. هر نوع از شبکه  می تواند تحلیل شود مثل توپولوژی اینترنت(مثل مثل ارتباط های میان ماشین ها) شبکه های اشتراکی فایل های نظیر به نظیر، شبکه های بیولوژیکی ، شبکه های اجتماعی آنلاین( مثل فیس بوک و تویتتر) ارتباطات (مثل ایمیل) و شبکه های دوستی  همچنین شبکه های معنایی و شبکه های سازمانی و غیره. داده ها با فرمت های متفاوت زیر IMPORT  و EXPORT می شوند.

  • ورودی و خروجی (Input/Output):

گفی می تواند اکثر فایل های با فرمت گراف را بخواند، همچین فایل های CSV را نیز پشتیبانی می کند.

  • فرمت فایل های ورودی برای گفی

ابزار گفی عمده ی فرمت های معمول و معروف گراف را پشتیبانی میکند. در زیر برخی از فرمتهای قابل پشتیبانی توسط گفی آورده شده است. البته فرمت فایل خاص این نرم افزار پسوند gephi دارد.

  • CSV
  • Pajek NET
  • Guess GDF
  • GEXF
  • GraphML
  • Graphviz DOT
  • UCInet DL
  • NetdrawVNA
  • Tulip TLP
  • Excel Spreadsheetater

از بزرگتربن مزایای گفی تبدیل جداول به گراف توسط خود این نرم افزار است. که دوره های آموزشی ما این مبحث به طور کامل ارائه خواهد شد.

فرمت فایل های خروجی برای گفی

نرم افزار گفی برخی از فرمت های معمول گراف را به عنوان خروجی تولید کند. در زیر برخی از فرمتهای قابل پشتیبانی توسط گفی آورده شده است.

  • CSV
  • PAJEK NET
  • GUESS GDF
  • GEXF(Graph Exchange XML Format)
  • GRAPHML
  • EXCEL SPREADSHEET
  • SVG
  • PDF
  • PNG

نکته: فایلی به نام LESMISERABLES.GEXF برای آموزش در نرم افزار گفی در آدرس زیر بارگذاری شده است که از دانلود شده است. البته گفی قابلیت ساخت گراف های آزمایشی را برای آزمودن الگوریتم ها دارد البته این گراف ها رندوم با تصادفی نیستند چرا که گراف های تصادفی ارزش و قابلیت تحلیل را ندارد (برای اطلاعات بیشتر مبحث ساختار گراف شبکه های اجتماعی را مطالعه کنید).  گفی برای ساخت این گراف های غیر تصادفی از الگوریتم های خاص ساختن گراف های غیر رندوم استفاده میشود.

http://gephi.org/datasets/LesMiserables.gexf

رابط کاربری  نرم افزار گفی:

  • منوی OPEN:

این منو مثل همه نرم افزار ها برای وراد کردن فایل گرافی مورد نظر به منظور انجام فعالیت بر روی آن می باشد.

open menu
open menu

رابط کاربری گفی
قالب رابط کاربری گفی

گفی
قالب رابط کاربری گفی

 

سه mode یا حالت  زیر در منوی اصلی گفی در دسترس است که در mode امکانات خاص آن در ضفحه نمایش داده می شود:

  • Overview: graph manipulation mode.
  • Data Laboratory: data visualization in tables.
  • Preview: visual tuning before vectorial export.

در ادامه امکانات رابط گرافیکی گفی در مد Overview بررسی خواهد شد.

پنجره layout :

پنجره Layout در گوشه پایین سمت چپ رابط کاربری گفی قرار دارد. LAYOUT ها الگوریتم هایی هستند که گره ها را در فضای گرافیکی دو بعدی یا سه بعدی قرار می دهند. که در علم تحلیل گراف به آن بصری سازی یا بازنمایی می گویند. همانطور که گفته شد بصری سازی بر اساس زمان واقعی (Real-time visualization) در گفی انجام میشود. به عبارتی کاربر میتواند مراحل بصری سازی را مثل یک انیمیشن تماشا کند. نرم افزار گفی به عنوان یکی از سریع ترین موتورهای ترسیم گراف های بزرگ شناخته می شود (موتور ad-hoc OpenGL). گفی قابلیت ترسیم گراف هایی تا ۱۰۰٫۰۰۰ گره و ۱٫۰۰۰٫۰۰۰ یال را دارد (البته این تعداد بستگی به نوع الگوریتم ها دارد). و همچنین قابلیت تکرار از طریق تجسم با استفاده از dynamic filtering دارد و نهایتا گفی ابزار غنی برای دستکاری نمودارها در زمان محدود است.

الگوریتم های ویرایش طرح های شبکه (Foce-based algorithms) امکان دستکاری نحوه ترسیم شبکه ها را فراهم می سازد. این طرح ها امکان تغییر گراف ها را در حین اجرا به کاربر می دهد تا گراف بهینه را انتخاب نماید.

الگوریتم FORCE-DIRECTED( قدرت جهت دار)

  • این LAYOUT ها متکی براستعاره فیزیکی از مکان گره ها برطبق مکان گره های دیگر است. تقریبا ،از اتصال گره های متمایل به نزدیک شدن، همچنین جداشدن گره های متمایل به دور شدن صحبت می کند.

الگوریتم FRUCHTERMAN-REINGOLD

  • این LAYOUT  گراف را در یک سیستم(مجموعه) از توده های ریز  شبیه سازی می کند .گره ها توده های ریز هستند و یال ها ارتباط میان توده ها هستند. الگوریتم سعی در حداقل کردن انرژی این سیستم فیزیکی دارد.

الگوریتم FORCEATLAS

  • یک LAYOUT خانگی از گفی است. یک LAYOUT  یا نمایه شبکه های جهانی واقعی است که ویژگیهای زیر را دارد: توزیع آزاد-مقیاسی از درجه گره، و تاثیر جهان-کوچک(مثل فاصله کم بین همه گره ها).بر قابلیت خوانایی تمرکز می کند اما کند است.

الگوریتم FORCEATLAS2

  • بهبود ورژن FORCEATLAS برای شبکه های بزرگ است که قابلیت خوانایی خوبی دارد.ارتباط گره ها تقریبی ازمحاسبات  BARNES-HUT است که بنابراین پیچیدگی الگوریتم را کاهش می دهد.

الگوریتم OPENORD

  • الگوریتم force-directed layout می تواند تا ۱میلیون گره توسعه داده شود اما الگوریتم OPENORD ایده ایی برای گراف های بزرگتر است. این الگوریتم وزن گراف های غیر جهت دار را پیش بینی می کند وبرای مشخص کردن کلاستر بهتر استفاده می شود. این الگوریتم  می تواند به صورت موازی در چند چروسس با سرعت بالا اجرا شود و به صورت اتوماتیک متوقف می شود.

الگوریتم YIFAN HU MULTILEVEL

  • سریعترین الگوریتم با کیفیت خوب در گراف های بزرگ است. این مدل با مدل FORCE DIRECTED ترکیب شده و پیچیدگی را کاهش می دهد.قدرت رانشی در یک گره از کلاستر گره های دور توسط محاسبات BARNES-HUT  تقریب زده می شوند که به گره سوپر(ممتاز) می پردازند.به صورت اتوماتیک متوقف می شود.

LAYOUTS های دیگر در ادامه

الگوریتم CIRCULAR

  • گره ها به شکل دایره براساس خصلت های گره مرتب می شوند.این الگوریتم برای نمایش توزیع گره ها با ارتباط هایشان (لینک هایشان)مفید است.

الگوریتم RADIAL AXIS

  • این الگوریتم گره ها را گروهبندی می کند و گروه ها را در محور متقارن برحسب رادیان به طرف خارج از مرکز دایره می کشد. گروه ها ی تولید شده از یک متریک(درجه ، بینیت مرکزی و…) یا یک صفت استفاده می کند. برای مطالعه هموفیلی توسط نمایش توزیعی از گره ها داخل گروه ها با لینک هایشان مفید است

الگوریتم GEOGRAPHICAL

  • این الگوریتم در طول جغرافیایی وسیع و پهناور بر طبق  مکان مجموعه  گره ها در فضای گراف استفاده می شود. در پروزژ های مختلف در دسترس هستند شامل مرکاتور(جغرافی دان و نقشه نگار ایتالیایی) که از گوگل مپ و دیگر سرویس های آنلاین استفاده کرد

  zoom & pan

از این گزینه به جهت زوم کردن بر روی گراف استفاده میشود.

ranking(SIZE)

از این گزینه برای روش سایز بندی  اتوماتیک گره ها استفاده می کنیم.

RANKING(COLOR)

از این گزینه برای روش  رنگ بندی  اتوماتیک گره ها استفاده می کنیم.

 labeling nodes

با این گزینه میتوان بر روی گره های مد نظر خود برچسب گذاری کنیم.

پنجره معیارها یا (Metrics):

پنجره متریک ها در سمت راست صفحه قرار دارد و الگوریتم های آن شامل سه دسته زیر هستند:

دسته اول معیارهای شبکه :

  • DIAMETER(قطر-ضخامت)

بیشترین فاصله میان همه جفت گره ها.

  • DENSITY(چگالی- تراکم)

معیاری است که چگونگی نزدیکی شبکه به کامل شدن را نشان می دهد یک گراف کامل  همه یال های فعال و چگالی مساوی یک  را دارد.

  • LOUVAIN MODULARITY
  • NUMBER OF CONNECTED COMPONENT( تعداد اتصال مولفه ها)

اتصال مولفه ها زیرگراف هایی است  در یک مسیر موجود میان همه جفت گره ها، و نبود مسیر موجود از یک گره در زیرگراف یک گره که در زیرگراف نیست.

احتمال اینکه هر دو نود تصادفی از همسایه ی A با هم دوست باشند. اگر ضریب خوشه بندی زیاد باشد یعنی تراکم بیشتر است.

دسته دوم معیارهای گره:

  • DEGREE CENTRALITY( درجه مرکزیت)

درجه ی گره تعداد یال هایی است که مجاور گره است.

  • BETWEENNESS CENTRALITY( مرکزیت بینیت)

معیاری است که کوتاهترین مسیر بین گره ها در شبکه است.

میانگین فاصله از یک گره با گره های دیگر در شبکه

  • EIGENVECTOR CENTRALITY()

گره مهم در یک شبکه مبتنی بر ارتباطات گره . یک گره مرکزی وسیع است که گره با دیگرگره ها که مرکزی هستند متصل شده باشد.

  • PAGE RANK

در نظر گرفتن احتمال اینکه یک کاربر به یک صفحه براساس هایپرلینک ها  دسترسی داشته است

  • HITS

الگوریتم تحلیل لینک  با نرخ صفحات وب است که توسط Jon Kleinberg [Kleinberg, 1999] توسه پیدا کرد. متریک HITS دو مقدار برای یک صفحه مشخص می کند : امتیاز (نویسنده) آن ،که ارزش محتوای صفحه را تخمین می زند و ارزش هاب (پرش) که ارزش لینک ها به دیگر صفحات را تخمین می زند.

دسته سوم معیارهای یال:

  • AVERAGE PATH LENGHT(میانیگین طول مسیر)

میانگین فاصله میان همه جفت گره هاست.گره های مرتبط دارای مسافت ۱ است.قطر طولانی ترین فاصله میان هر دو گه در شبکه است.

  • متریک های پویا:

تعدادی از متریک ها می تواند براساس زمان محاسبه شود: تعداد گره ها،تعداد یال ها،میانگین درجه و ضریب خوشه بندی

 RANKING(SIZE)

از این گزینه برای روش سایز بندی و رنگ بندی  اتوماتیک گره ها استفاده می کنیم. که شامل دو روش زیر میباشد:

  • dark (degree): many connections بخش های تیره :اتصالات زیادرا نشان می دهد
  • large: mediator of two groups بخش های بزرگ : دلال دو گروه را نشان می دهد

 community detection یا تشخیص انجمن در گفی

پیمانه ای
Modularity

 

 فیلترسازی دینامیکی (Dynamic filtering):

شما می توانید فیلترهایی ایجاد کنید که می تواند گره ها و یال ها را در شبکه مخفی کند. ما فیلتری برای حذف برگ ها (مثل گره های با یک یال ) را ایجاد می کنیم.

فیلتر ساختار شبکه یا نوع داده ها بر اساس ندها یا/و لینک های انتخاب شده. استفاده از رابط کاربری تعاملی به منظور فیلتر شبکه در زمان واقعی.

  • ایجاد فیلترسازی های پیچیده بدون برنامه نویسی
  • ساخت شبکه جدید از داده های فیلتر شده
  • ذخیره نمایش های مورد علاقه

فیلتر

export:

در این منو میتوانیم با فرمت دل خواه از گراف تحلیل شده خود خروجی بگیریم.

شبکه ها در طول زمان (Networks over time):

از نظر بررسی دینامیک شبکه ها، نرم افزار گفی در خط مقدم نوآوری قرار گرفته است. توسط این نرم افزار می توان رفتار یک شبکه را در طی زمان بررسی کرد.

  • وارد کردن گراف زمانی با استفاده از فرمت فایل GEXF
  • اندازه گیری معیارهای آماری در طول زمان مانند ضریب خوشه بندی Clustering coefficient
  • تهیه گراف متحرک
تحلیل داینامیکی
gephi time line

جدول داده ها و ویرایش آن (Data table and edition):

گفی صفحه مخصوص به خودش برای نمایش، دستکاری، جستجو و ذخیره داده ها را دارد که شبیه به Excel است.

  • قدرت جستجو/جایگزینی داده ها
  • دستکاری ستون ها
  • ویرایش دسته ای، ادغام دسته های سفارش و غیره
جدول گفی
gephi table

توسعه پذیری (Extensible):

مرکز پلاگین های گفی به طور خودکار لیستی از پلاگین های موجود در پرتال پلاگین گفی را نمایش می دهد. ده ها نوع از پلاگین های تشخیص اجتماع هستند که قابلیت های گفی را گسترش می دهند.

نکته: در صورتی که علاقمند به شرکت در دوره های آموزشی تحلیل شبکه های اجتماعی هستید، بر روی اینجا کلیک کنید.


درس کانال تلگرام ما:

t.me/bigdata_channel

آدرس کانال سروش ما:
https://sapp.ir/bigdata_channel

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *