خانه --> تحلیل شبکه های اجتماعی --> فرمت و ساختار داده ی فایل های گرافی یا مدل داده گراف (Graph Data Structure)

فرمت و ساختار داده ی فایل های گرافی یا مدل داده گراف (Graph Data Structure)

به منظور فرایند گراف کاوی در تحلیل شبکه های اجتماعی میبایست گراف ها را در ساختار مناسب ذخیره کنیم. ساختار داده گراف یا مدل داده گراف دارای عناصر متفاوتی است که برای نگهداری اطلاعات گراف استفاده میشود. بنابراین ساختار فایل های گراف باید به گونه ای باشد که بتواند اطلاعات زیر را در خود نگهداری کند:

  • گره ها یا نودهای گراف (یا شبکه) میتوانند انواع مختلفی داشته باشند.
  • گره ها میتوانند نیز شامل اطلاعات باشند.
  • ارتباطات گراف که در اصل یال ها یا لبه های گراف هستند
  • یال ها میتوانند جهت دار یا بدون جهت باشند.
  • یال ها میتوانند وزن داشته باشند
  • یال ها میتوانند برچسب متنی خورده باشندیا دارای علامت باشند (مثلا علامت مثبت و منفی)

 

ساختار فایل های گراف

 

ساختار فایل های گراف باید به گونه ای باشد که بتواند تمام اطلاعات یک گراف حتی بعد از تحلیل و بصری سازی را در خود حفظ کند

ساختارهای داده‌ای معمول برای نگهداری گراف عبارت است از:

  • لیست مجاورت (adjacency list)
  • ماتریس مجاورت (adjacency matrix)
  • ماتریس برخورد
  • تک جدول
  • دو جدولی
دو جدولی
دو جدولی

 

جهت ذخیره و بازیابی اطلاعات گراف بر روی فایل، فرمت های و ساختار های مختلفی وجود دارد که معروفترین آنها در ذیل آمده است:

  • Graph Markup Language (GML)
  • Graph Data File (GDF)
  • Network Format (NET)
  • MATLAB format (MAT)
  • Comma Separated Value (CSV)
  • Graph Exchange XML Format (GEXF)
  • و قالبهای دیگری که به فراخور کاربرد و نرم افزار ممکن است مورد استفاده قرار گیرد.

وقتی در حال تحلیلِ شبکه های اجتماع هستیم باید بدانیم که ساختار یک شبکه ممکن است در طول زمان تغییر کند. از این رو نرم افزار بازنمایی شبکه باید بتواند اطلاعات زمانی را نیز در شبکه ذخیره کند. نودها و یالها ممکن است است حاوی اطلاعاتی باشند که در تحلیل شبکه موثر واقع شوند. نگهداری این اطلاعات همراه نودها و یالها خود میتواند از جمله قابلیتهای مهم در ذخیره سازی گراف باشد. چرا که تمامی این اطلاعات برای فرایند گراف کاوی استفاده خواهد شد.

در زیر نمونه هایی از فایل گراف با فرمت GEXF یا (Graph Exchange XML Format) آورده شده است.

در ادامه نمونه ای دیگر از قالب GEXF با جزئیات بیشتر آورده شده است:

آدرس کانال تلگرام سایت بیگ دیتا:

t.me/bigdata_channel

آدرس کانال سروش ما:
https://sapp.ir/bigdata_channel

جهت دیدن سرفصل های دوره های آموزشی بر روی اینجا کلیک کنید.

۲ دیدگاه

  1. بازتاب ها: فایل فرهنگ لغت فارسی با فرمت csv (قابل بارگذاری بر روی پایگاه های داده) |

  2. بازتاب ها: فایل دیکشنری فارسی با فرمت csv (قابل بارگذاری بر روی تمامی دیتابیس ها) | خانه بیگ دیتای ایران

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *