مقایسه کاساندرا با پایگاه داده های غیر رابطه ای HBase, MongoDB, CouchDB, Neo4j
مقایسه کاساندرا با HBase, MongoDB, CouchDB, Neo4j
در این مطالعه در دانشگاه Coimbra پایگاه دادههای Neo4j، Cassandra، Hbase، MongoDB، OrientDB، و Redis مورد ارزیابی قرار گرفتهاند. همچنین محققان دانشگاه تورنتو مطالعهای در جهت بررسی عمکرد چندین پایگاه داده NoSQL یک سری آزمایش انجام داده اند که در این آزمایشها برتری Cassandra نسبت به پایگاه داده های NoSQL مورد آزمایش دیگر (Hbase, MongoDB) از جنبههای مختلف اثبات شده است. در این ارزیابی، محققان این پایگاه دادهها را از جنبههای بارگذاری، خواندن، نوشتن، اسکن، و به روز رسانی داده مورد آزمایش قرار دادهاند.
در زیر صرفا با نمایش چند نمودار پایگاه غیر رابطه ای کاساندرا را با پایگاه داد های غیر رابطه ای دیگر مقایسه میکنیم. نمودار ها و شکل ها کاملا گویا هستند به خاطر همین از شرح آنها خود داری میکنیم.
مقیاس پذیری خطی جزء قابلیت هایی است که نمی شود از آن صرف نظر کرد. نمودار زیر این مقیاس را برای چند پایگاه داده ی مهم نمایش می دهد. نتیجه ی مقیاس پذیری کاساندرا در این شکل حیرت آور است.
در شکل زیر نیز کارایی چهار پایگاه داده NoSql مختلف با توجه به تعداد گرهها نمایش داده شده است. مطابق این آزمایش Cassandra بیشترین کارایی را نسبت به سایر پایگاه دادهها دارد.
خصوصایت جزئی تر کاساندرا با سایر پایگاه های داده
در شکل زیر به روند رو به رشد استفاده از پایگاه داده های مبتنی بر گراف در سال های اخیر توجه کنید. از این شکل میتوان نتیجه گرفت که رشد رویکرد استفاده از پایگاه داده های مبتنی بر گراف از بقیه پایگاه داده های غیر رابطه ای بیشتر است.
تمامی چهار پایگاه داده تشریح شده دارای ساختار NoSQL هستند و برای مدیریت داده های بزرگ مناسب میباشند. MongoDB نسبت به سایر رقبای خود از پشتیبانی نرمافزاری بهتری برخوردار است و تعداد زبانهای برنامه نویسی که قابلیت برقراری ارتباط با این پایگاه داده را دارند فوقالعاده بیشتر است همچنین یادگیری آن سادهتر میباشد که سبب شده بیشترین کاربر را داشته باشد. لازم به ذکر است که Cassandra از اسکریپت سمت سرور برعکس رقبا پشتیبانی نمیکند. شکل زیر میزان استفاده از پایگاه دادههای مختلف بر اساس آمار Linkedin را نمایش میدهد. این آمار به طور تقریبی تا سال 2017 همچنان به همین شکل است.
مقایسه شاخص گذاری در اسناد متنی بین ده پایگاه داده معروف در سال 2015
نتیجهگیری
با توجه به اینکه در مطالعه ذکر شده، Cassandra نسبت به پایگاه دادههای دیگر برتری محسوسی داشته است و همچنین با توجه به قابلیتهای آن مثل پیکربندی آسان، مقیاسپذیری خطی، سرعت و پایداری که این پایگاه داده ارائه میدهد، این پایگاه داده مناسبترین گزینه برای اکثر کاربرد ها در حوزیه کلان داده میباشد. پیشنهاد میشود برای دیدن سایر محصولات آپاچی در حوزه کلان داده به این مبحث مراجعه کنید.
از نظر بیشترین تعداد مورد استفاده مانگو رتبه اول را دارد و از نظر بیشترین شتاب اشتیاق کاربران برای استفاده پایگاه داده های مبتنی بر گراف رتبه اول را دارند. همچنین پایگاه داده ی Redis سریع ترین بود هرچند که امکانات آن قابل توجه نبود. در نهایت باید توجه داشت که هر چه پایگاه داده های غیر رابطه ای به سمت پشتیبانی دادهای پیچیده تر میروند، به همان میزان توان پشتیبانی داده های بزرگ تر را از دست می دهند.
http://www.datastax.com/wp-content/uploads/2013/02/WP-Benchmarking-Top-NoSQL-Databases.pdf
آدرس کانال تلگرام سایت بیگ دیتا:
آدرس کانال سروش ما:
https://sapp.ir/bigdata_channel
جهت دیدن سرفصل های دوره های آموزشی بر روی اینجا کلیک کنید.
بازدیدها: 2759
برچسبapache Big Data Cassandra CouchDB MongoDB neo4j nosq NOSQL OrientDB Titan آپاچی تایتان خانواده ستون ستون گسترده سند گرا غیر رابطه ای مانگو مبتنی بر گراف مقایسه مقایسه پایگاه داده های غیر رابطه ای مقایسه کاساندرا با HBase مقایسه کاساندرا با پایگاه داده های غیر رابطه ای HBase
همچنین ببینید
تحلیل گراف های بزرگ با آپاچی فلینک (Apache Flink)
تعریف جریان داده: جریان داده ها، داده هایی هستندکه بطور مداوم توسط هزاران منبع داده …
آغاز کلان داده در میکروسافت با پشتیبانی پایگاه داده MS-SQLServer از بیگ دیتا
جایگاه کلان داده در میکروسافت استفاده از Big Data Cluster در SQL Server 2019 باعث …