به منظور فرایند گراف کاوی در تحلیل شبکه های اجتماعی میبایست گراف ها را در ساختار مناسب ذخیره کنیم. ساختار داده گراف یا مدل داده گراف دارای عناصر متفاوتی است که برای نگهداری اطلاعات گراف استفاده میشود. بنابراین ساختار فایل های گراف باید به گونه ای باشد که بتواند اطلاعات زیر را در خود نگهداری کند:
- گره ها یا نودهای گراف (یا شبکه) میتوانند انواع مختلفی داشته باشند.
- گره ها میتوانند نیز شامل اطلاعات باشند.
- ارتباطات گراف که در اصل یال ها یا لبه های گراف هستند
- یال ها میتوانند جهت دار یا بدون جهت باشند.
- یال ها میتوانند وزن داشته باشند
- یال ها میتوانند برچسب متنی خورده باشندیا دارای علامت باشند (مثلا علامت مثبت و منفی)
ساختار فایل های گراف باید به گونه ای باشد که بتواند تمام اطلاعات یک گراف حتی بعد از تحلیل و بصری سازی را در خود حفظ کند
ساختارهای دادهای معمول برای نگهداری گراف عبارت است از:
- لیست مجاورت (adjacency list)
- ماتریس مجاورت (adjacency matrix)
- ماتریس برخورد
- تک جدول
- دو جدولی
جهت ذخیره و بازیابی اطلاعات گراف بر روی فایل، فرمت های و ساختار های مختلفی وجود دارد که معروفترین آنها در ذیل آمده است:
- Graph Markup Language (GML)
- Graph Data File (GDF)
- Network Format (NET)
- MATLAB format (MAT)
- Comma Separated Value (CSV)
- Graph Exchange XML Format (GEXF)
- و قالبهای دیگری که به فراخور کاربرد و نرم افزار ممکن است مورد استفاده قرار گیرد.
وقتی در حال تحلیلِ شبکه های اجتماع هستیم باید بدانیم که ساختار یک شبکه ممکن است در طول زمان تغییر کند. از این رو نرم افزار بازنمایی شبکه باید بتواند اطلاعات زمانی را نیز در شبکه ذخیره کند. نودها و یالها ممکن است است حاوی اطلاعاتی باشند که در تحلیل شبکه موثر واقع شوند. نگهداری این اطلاعات همراه نودها و یالها خود میتواند از جمله قابلیتهای مهم در ذخیره سازی گراف باشد. چرا که تمامی این اطلاعات برای فرایند گراف کاوی استفاده خواهد شد.
در زیر نمونه هایی از فایل گراف با فرمت GEXF یا (Graph Exchange XML Format) آورده شده است.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
<span style="color: #800000;"><strong><samp><i class="c"><?xml version=<i>"1.0"</i> encoding=<i>"UTF-8"</i>?></i> <gexf xmlns=<i>"http://www.gexf.net/1.2draft"</i> version=<i>"1.2"</i>> <meta lastmodifieddate=<i>"2009-03-20"</i>> <creator>Gexf.net</creator> <description>A hello world! file</description> </meta> <graph mode=<i>"static"</i> defaultedgetype=<i>"directed"</i>> <nodes> <node id=<i>"0"</i> label=<i>"Hello"</i> /> <node id=<i>"1"</i> label=<i>"Word"</i> /> </nodes> <edges> <edge id=<i>"0"</i> source=<i>"0"</i> target=<i>"1"</i> /> </edges> </graph> </gexf> </samp></strong></span> |
در ادامه نمونه ای دیگر از قالب GEXF با جزئیات بیشتر آورده شده است:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 |
<strong><span style="color: #800000;"><samp><?xml version="1.0" encoding="UTF-8"?> <gexf xmlns="http://www.gexf.net/1.2draft" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.gexf.net/1.2draft http://www.gexf.net/1.2draft/gexf.xsd" version="1.2"> <meta lastmodifieddate="2009-03-20"> <creator>Gephi.org</creator> <description>A Web network</description> </meta> <graph defaultedgetype="directed"> <attributes class="node"> <attribute id="0" title="url" type="string"/> <attribute id="1" title="indegree" type="float"/> <attribute id="2" title="frog" type="boolean"> <default>true</default> </attribute> </attributes> <nodes> <node id="0" label="Gephi"> <attvalues> <attvalue for="0" value="http://gephi.org"/> <attvalue for="1" value="1"/> </attvalues> </node> <node id="1" label="Webatlas"> <attvalues> <attvalue for="0" value="http://webatlas.fr"/> <attvalue for="1" value="2"/> </attvalues> </node> <node id="2" label="RTGI"> <attvalues> <attvalue for="0" value="http://rtgi.fr"/> <attvalue for="1" value="1"/> </attvalues> </node> <node id="3" label="BarabasiLab"> <attvalues> <attvalue for="0" value="http://barabasilab.com"/> <attvalue for="1" value="1"/> <attvalue for="2" value="false"/> </attvalues> </node> </nodes> <edges> <edge id="0" source="0" target="1"/> <edge id="1" source="0" target="2"/> <edge id="2" source="1" target="0"/> <edge id="3" source="2" target="1"/> <edge id="4" source="0" target="3"/> </edges> </graph> </gexf></samp></span></strong> |
آدرس کانال تلگرام سایت بیگ دیتا:
آدرس کانال سروش ما:
https://sapp.ir/bigdata_channel
جهت دیدن سرفصل های دوره های آموزشی بر روی اینجا کلیک کنید.
بازدیدها: 2164