فرمت و ساختار داده ی فایل های گرافی یا مدل داده گراف (Graph Data Structure)

ساختار فایل های گراف

به منظور فرایند گراف کاوی در تحلیل شبکه های اجتماعی میبایست گراف ها را در ساختار مناسب ذخیره کنیم. ساختار داده گراف یا مدل داده گراف دارای عناصر متفاوتی است که برای نگهداری اطلاعات گراف استفاده میشود. بنابراین ساختار فایل های گراف باید به گونه ای باشد که بتواند اطلاعات زیر را در خود نگهداری …

ادامه مطلب

بررسی معیارهای مرکزیت (Centrality) در تحلیل شبکه های اجتماعی

مقایسه Gephi با Cytoscape

معیارهای مرکزیت (centrality) نحوه اتصال یک نود به نودهای دیگر در یک شبکه اجتماعی میتواند اطلاعاتی راجع به مهم بودن و یا مهم نبودن آن نود در کاربردهای خاص مشخص نماید. بعنوان مثال میتوانیم مشخص کنیم کدام نود در انتشار شایعه بیشترین تاثیر را در یک شبکه اجتماعی دارد. برای سنجش میزان اهمیت، از شاخصهای …

ادامه مطلب

بررسی ساختار و توپولوژی گراف شبکه های اجتماعی

سوالات شبکه های پیچیده پویا

بررسی ساختار و توپولوژی گراف شبکه های اجتماعی شبکه‌هاي اجتماعي  به طور عمده از دو ديدگاه قابل بررسي مي‌باشند: ساختار و ديناميک ( به زبان ساده داینامیک یعنی تحلیل در بستر زمان). بررسي‌ها نشان مي‌دهد که اين شبکه ها در خصوصيات مشترک ساختاري به طرز قابل توجّهي اشتراک دارند. تحلیل های با ارزشی به منظور …

ادامه مطلب

مروری بر نسخه های آپاچی کاساندرا (Apache Cassandra)

پايگاه داده کاساندرا

نکته­ مهمی که باید پیش از نصب و راه ­اندازی Cassandra به آن توجه کرد، نسخه آن است. جدیدترین نسخه Cassandra (در زمان تحریر این سند) 3.9 و جدیدترین نسخه پایدار آن، 2.2.8 است. نسخه 2.2.8 ، پایان حیات سری 2.0 است (یعنی آخرین نسخه در سری دو، 2.2 است) و این نسخه تا زمان …

ادامه مطلب

خصوصیات و امکانات آپاچی کاساندرا نسخه سری 3.9

cassandra3 vs cassandra2

نکته­ مهمی که باید پیش از نصب و راه­ اندازی Cassandra به آن توجه کرد، نسخه آن است. جدیدترین نسخه Cassandra (در زمان تحریر این سند) 3.9 و جدیدترین نسخه پایدار آن، 2.2.8 است. نسخه 2.2.8 ، پایان حیات سری 2.0 است (یعنی آخرین نسخه در سری دو، 2.2 است) و این نسخه تا زمان …

ادامه مطلب

معماری پایگاه داده مانگو (MangoDB )

معماری پایگاه داده مانگو

در این مبحث به توضیحات مختصصری در رابطه با معماری پایگاه داده مانگو در بخشبندی داده و نوزیع شدگی میپردازیم. در مباحث قبل با واحد های داده ای در MongoDB آشنا شدیم. معماری پایگاه داده مانگو در روش بخشبندی Sharding: به معنی پردازش از طریق چندبخشی نمودن داده ها و ذخیره سازی هر بخش در …

ادامه مطلب

واحدهای داده ای در پایگاه داده ی مانگو (MongoDB)

منگو دی بی مانگو

مدل واحدهای داده ای در MongoDB: بلعکس پایگاه داده های رابطه ای که همگی از ایده جداول (مجموعه ها) و رابطه ها ایجاد شده اند، هر پایگاه داده غیر رابطه ای (NOSQL) ایده ای خاص در نگهداری داده های مطلوب به خود دارد که در مبحث انواع پایگاه داده های غیر رابطه ای به آن …

ادامه مطلب

مقایسه کاساندرا با پایگاه داده های غیر رابطه ای HBase, MongoDB, CouchDB, Neo4j

مقایسه کاساندرا با HBase, MongoDB, CouchDB, Neo4j

مقایسه کاساندرا با HBase, MongoDB, CouchDB, Neo4j در این مطالعه در دانشگاه Coimbra پایگاه داده‌های Neo4j، Cassandra، Hbase، MongoDB، OrientDB، و Redis مورد ارزیابی قرار گرفته‌اند. همچنین محققان دانشگاه تورنتو مطالعه‌ای در جهت بررسی عمکرد چندین پایگاه داده NoSQL یک سری آزمایش انجام داده اند که در این آزمایش‌ها برتری Cassandra نسبت به پایگاه داده …

ادامه مطلب

مقدمه ای بر پایگاه داده های مبتنی بر گراف و Neo4j

مقدمه ای بر پایگاه داده Neo4j

اغلب پایگاه داده های مبتنی بر گراف به طور طبیعی زیرمجموعه‌ای از NoSql ها محسوب می‌شوند و اطلاعاتشان را به صورت key-value یا دیتابیس سند محور (document-oriented database) ذخیره می‌کنند. در شرایط کلی آنها می‌توانند به عنوان دیتابیس key-value با بهره‌گیری از مفهوم روابط پذیری (relationship) در نظر گرفته شوند. روابط (Relationships) در ذخیره‌سازی داده‌ها …

ادامه مطلب

انواع پایگاه داده های غیر رابطه ای یا NOSQL

انواع پایگاه داده غیر رابطه ای

انواع پایگاه داده های NOSQL: پایگاه داده های غیر رابطه ای براساسِ روشی که داده­  ها را ذخیره می­کنند، دسته ­بندی می­شوند. هر چند امروزه بعضی از پایگاه داده های غیر رابطه ای پا را از دسته بندی مطرح شده در این مبحث فراتر گذاشته و به صورت چند منظوره عمل میکنند. البته قبل از …

ادامه مطلب

قضیه CAP (ویژگیهایConsistency,Partition tolerance,Availability)

,Partition tolerance,Consistency, Availability

قضیه CAP : عبارت CAP ترکیب سرنام مفاهیم زیر است: سازگاری (Consistency): در هنگام توزیع شدگی، بخش‌ها اطلاعات یکسانی را در لحظه داشته باشند. دسترسی‌پذیری (Availability): هر درخواست خواندن و نوشتنی همیشه بدون پاسخ نباشد. تحمل بخش‌ها(Partition tolerance): در هنگام توزیع شدگی هر بخشی از داده‌ها جداگانه به کار خود ادامه دهد. در ادامه توضیحات …

ادامه مطلب

نصب کاساندرا در ویندوز (Cassandra for Windows)

OS

شاید باور اینکه  پایگاه داده قدرتمند کاساندرا به راحتی بر روی سیستم عامل ویندوز نصب میشود سخت باشد ولی از آنجایی که این پایگاه داده با زبان جاوا توسعه داده شده است، توسعه دهندگان آن بسته متانسب با اجرای کاساندرا در ویندوز را برای مصرف کنندگان توسعه داده اند. هر چند همچنان بهترین گزینه اجرای …

ادامه مطلب

بررسی مانگو (MongoDB)

معماری پایگاه داده مانگو

بررسی MongoDB: مانگو در سال 2007 توسط شرکت 10gen شروع به توسعه شد و در مارس 2010 اولین نسخه آن منتشر شد. Mangodb یک پایگاه داده سند گرا می‌باشد که از اعضای خانواده NOSQL می‌باشد. ساختار استفاده شده در  پایگاه داده مانگو JSON می‌باشد و اطلاعات را بدون شمای (schema) خاصی ذخیره می‌کنند. این پایگاه …

ادامه مطلب

درآمدی بر بانک های اطلاعاتی غیر رابطه ای (NoSql)

بانک های اطلاعاتی غیر رابطه ای

پایگاه داده های NoSQL ها در واقع همان بانک های اطلاعاتی غیر رابطه ای و توزیع شده هستند که لزوما برای نگهداری داده ها نیازی به ساختار جدول ندارد و میتواند به سادگی عملیات Replication را انجام دهد. البته ایده پایگاه داده NoSQL تقریبا بیش از 1۰سال است که در محافل اینترنتی بوجود آمده است. این …

ادامه مطلب

سازگاری خواندن و نوشتن داده در سرور های کاساندرا Consistency

خواندن و نوشتن در کاساندرا

کاساندرا از یک تعادل بین سازگاری و در دسترس بودن از طریق سطوح سازگاری ایجاد می‌کنند. اساساً، سطح سازگاری یک عملیات مشخص‌کننده این است چه تعداد replica  باید پاسخ دهند تا از صحت یک عمل مطمئن شویم. قبل از هر چیز بهتر است مفهوم تکرار(Replication) و توزیع(Partitioning) مورد بررسی قرار بگیرد. به این منظور به …

ادامه مطلب

مدل داده ای و تعریف شِما در کاساندرا (Data Model)

مدل داده ای کسندرا

برای آشنایی با مدل داده‌ای کاساندرا، بهتر است از مفاهیم ساده و ابتدایی برای ذخیره‌سازی داده‌ها شروع شود. ساده‌ترین حالت ذخیره‌سازی داده‌ای با استفاده از یک آرایه یا لیست قابل پیاده‌سازی است. در این حالت، برای فهمیدن این‌که هر عنصر ذخیره کننده چیست، باید اسناد و دانشی درباره آن به‌صورت خارجی نگه‌داری شود. همچنین،  برای …

ادامه مطلب