مقایسه کاساندرا با پایگاه داده های غیر رابطه ای HBase, MongoDB, CouchDB, Neo4j

مقایسه کاساندرا با HBase, MongoDB, CouchDB, Neo4j

در این مطالعه در دانشگاه Coimbra پایگاه داده‌های Neo4j، Cassandra، Hbase، MongoDB، OrientDB، و Redis مورد ارزیابی قرار گرفته‌اند. همچنین محققان دانشگاه تورنتو مطالعه‌ای در جهت بررسی عمکرد چندین پایگاه داده NoSQL یک سری آزمایش انجام داده اند که در این آزمایش‌ها برتری Cassandra نسبت به پایگاه داده های NoSQL مورد آزمایش دیگر (Hbase, MongoDB) از جنبه‌های مختلف اثبات شده است. در این ارزیابی، محققان این پایگاه داده‌ها را از جنبه‌های  بارگذاری، خواندن، نوشتن، اسکن، و به روز رسانی داده مورد آزمایش قرار داده‌اند.

در زیر صرفا با نمایش چند نمودار پایگاه غیر رابطه ای کاساندرا را با پایگاه داد های غیر رابطه ای دیگر مقایسه میکنیم. نمودار ها و شکل ها کاملا گویا هستند به خاطر همین از شرح آنها خود داری میکنیم.

مقایسه نوشتن در کسندرا با Hbase و MongoDB
مقایسه نوشتن در کسندرا با Hbase و MongoDB

مقایسه پایگاه داده های مبتنی بر سند
مقایسه پایگاه داده های مبتنی بر سند

مقایسه پایگاه داد های مبتنی بر ستون
مقایسه پایگاه داد های مبتنی بر ستون

مقیاس پذیری خطی جزء قابلیت هایی است که نمی شود از آن صرف نظر کرد. نمودار زیر این مقیاس را برای چند پایگاه داده ی مهم نمایش می دهد. نتیجه ی مقیاس پذیری کاساندرا در این شکل حیرت آور است.

مقیاس پذیری خطی
linear scale performance

در شکل زیر نیز کارایی چهار پایگاه داده NoSql مختلف با توجه به تعداد گره­ها نمایش داده شده است. مطابق این آزمایش Cassandra  بیشترین کارایی را نسبت به سایر پایگاه داده‌ها دارد.

مقایسه کاساندرا با HBase, MongoDB, CouchDB, Neo4j
مقایسه کاساندرا با HBase, MongoDB, CouchDB, Neo4j

خصوصایت جزئی تر کاساندرا با سایر پایگاه های داده

مقایسه کاساندرا با HBase, MongoDB, CouchDB, Neo4j
مقایسه کاساندرا با HBase, MongoDB, CouchDB, Neo4j

در شکل زیر به روند رو به رشد استفاده از پایگاه داده های مبتنی بر گراف در سال های اخیر توجه کنید. از این شکل میتوان نتیجه گرفت که رشد رویکرد استفاده از پایگاه داده های مبتنی بر گراف از بقیه پایگاه داده های غیر رابطه ای بیشتر است.

db engines graph databas

تمامی چهار پایگاه داده تشریح شده دارای ساختار NoSQL هستند و برای مدیریت داده های بزرگ مناسب می‌باشند. MongoDB نسبت به سایر رقبای خود از پشتیبانی نرم‌افزاری بهتری برخوردار است و تعداد زبان‌های برنامه نویسی که قابلیت برقراری ارتباط با این پایگاه داده را دارند فوق‌العاده بیشتر است همچنین یادگیری آن ساده‌تر می‌باشد که سبب شده بیشترین کاربر را داشته باشد. لازم به ذکر است که Cassandra از اسکریپت سمت سرور برعکس رقبا پشتیبانی نمی‌کند. شکل زیر میزان استفاده از پایگاه داده­های مختلف بر اساس آمار Linkedin را نمایش می­دهد. این آمار به طور تقریبی تا سال 2017 همچنان به همین شکل است.

مقایسه کاساندرا با HBase, MongoDB, CouchDB, Neo4j
مقایسه کاساندرا با HBase, MongoDB, CouchDB, Neo4j

مقایسه شاخص گذاری در اسناد متنی بین ده پایگاه داده معروف در سال 2015

sept skillsi ndex
sept skillsi ndex

نتیجه‌گیری

با توجه به اینکه در  مطالعه ذکر شده، Cassandra نسبت به پایگاه داده‌های دیگر برتری محسوسی داشته است و همچنین با توجه به قابلیت‌های آن مثل پیکربندی آسان، مقیاس‌پذیری خطی، سرعت و پایداری که این پایگاه داده ارائه می‌دهد، این پایگاه داده مناسب‌ترین گزینه برای اکثر کاربرد ها در حوزیه کلان داده می‌باشد. پیشنهاد میشود برای دیدن سایر محصولات آپاچی در حوزه کلان داده به این مبحث مراجعه کنید.

از نظر بیشترین تعداد مورد استفاده مانگو رتبه اول را دارد و از نظر بیشترین شتاب اشتیاق کاربران برای استفاده پایگاه داده های مبتنی بر گراف رتبه اول را دارند. همچنین پایگاه داده ی Redis سریع ترین بود هرچند که امکانات آن قابل توجه نبود. در نهایت باید توجه داشت که هر چه پایگاه داده های غیر رابطه ای به سمت پشتیبانی دادهای پیچیده تر میروند، به همان میزان توان پشتیبانی داده های بزرگ تر را از دست می دهند.

مقایسه پایگاه داده های غیر رابطه ای
compare nosql

http://www.datastax.com/wp-content/uploads/2013/02/WP-Benchmarking-Top-NoSQL-Databases.pdf

آدرس کانال تلگرام سایت بیگ دیتا:

t.me/bigdata_channel

آدرس کانال سروش ما:
https://sapp.ir/bigdata_channel

جهت دیدن سرفصل های دوره های آموزشی بر روی اینجا کلیک کنید.

 

بازدیدها: 2759

همچنین ببینید

آپاچی فلینک

تحلیل گراف های بزرگ با آپاچی فلینک (Apache Flink)

تعریف جریان داده: جریان داده ها، داده هایی هستندکه بطور مداوم توسط هزاران منبع داده …

کلان داده در میکروسافت

آغاز کلان داده در میکروسافت با پشتیبانی پایگاه داده MS-SQLServer از بیگ دیتا

جایگاه کلان داده در میکروسافت استفاده از Big Data Cluster در SQL Server 2019 باعث …

دیدگاهتان را بنویسید