صفحه نخست --> مدیریت برچسب: کلان داده

مدیریت برچسب: کلان داده

اوضاع و آمار بیگ دیتا در سال ۲۰۱۷

آمار بیگ دیتا

اوضاع و آمار بیگ دیتا در سال ۲۰۱۷ در یک دقیقه در پست های قبل خواص بیگ دیتا را بررسی نمودیم. در این پست به آمار بیگ دیتا تولید شده در دنیا میپردزیم. حجم اطلاعاتی که تا سال ۲۰۰۳ توسط انسان ایجاد شد تنها ۵ اگزابایت است. امروزه این حجم ...

ادامه مطلب

محصولات و تکنولوژی های آپاچی در حوزه کلان داده و داده کاوی (ActiveMQ, OrientDB, Ant, AVRO, CouchDB, Elastic , Hadoop, Lucene, Mahout, Nutch, OpenNLP, Solr, Spark, Zookeper)

تکنولوژی های آپاچی

یکی از موسسات مطرح در زمینه پشتیبانی از داده های حجیم، بنیاد آپاچی می باشد. لذا شناخت محصولات و تکنولوژی های نرم افزاری آپاچی بسیار لازم است. معمولا از مجموعه ی این تکنولوژی ها تحت عنوان اکوسیستم هدوپ یاد میشود. در این مبحث تکنولوژی های آپاچی بررسی خواهد. ActiveMQ این ...

ادامه مطلب

نحوه کار و پرسوجو با Neo4j

neo4j GUI

در این بخش به نحوه کار و پرسوجو با بانک اطلاعات مبتنی بر گراف Neo4j میپردازیم. بعد از اجرا Neo4j در ویندوز یا در سیستم عامل لینوکس، در کاوشگر خود آدرس http://localhost:7474 را وارد میکنیم تا رابط کاربری برنامه نمایش داده شود. برای کاربرانی که تازه میخواهند با آن کار ...

ادامه مطلب

بصری سازی گراف شبکه های اجتماعی به روش الگوریتم OO یا (OpenOrd)

OO visualization

یکی از مسائل مهم حوزه گراف کاوی، ترسیم گراف یا بصری سازی است. یک گراف، یک شکل هندسی چندبعدی است که به خاطر همین خاصیت چندبعدی بودن آن بی‌نهایت ترسیم مختلف می‌توان از آن به وجود آورد که فقط تعداد معدودی از این ترسیم‌ها باارزش هستند. رسم گراف از این ...

ادامه مطلب

درآمدی بر بانک های اطلاعاتی غیر رابطه ای (NoSql)

بانک های اطلاعاتی غیر رابطه ای

پایگاه داده های NoSQL ها در واقع همان بانک های اطلاعاتی غیر رابطه ای و توزیع شده هستند که لزوما برای نگهداری داده ها نیازی به ساختار جدول ندارد و میتواند به سادگی عملیات Replication را انجام دهد. البته ایده پایگاه داده NoSQL تقریبا بیش از ۱۰سال است که در محافل ...

ادامه مطلب

مدل داده ای و تعریف شِما در کاساندرا (Data Model)

مدل داده ای کسندرا

برای آشنایی با مدل داده‌ای کاساندرا، بهتر است از مفاهیم ساده و ابتدایی برای ذخیره‌سازی داده‌ها شروع شود. ساده‌ترین حالت ذخیره‌سازی داده‌ای با استفاده از یک آرایه یا لیست قابل پیاده‌سازی است. در این حالت، برای فهمیدن این‌که هر عنصر ذخیره کننده چیست، باید اسناد و دانشی درباره آن به‌صورت ...

ادامه مطلب

مروری بر پایگاه داده کاساندرا و بررسی نکات ضعف و قدرت این بانک اطلاعاتی

مزایایی کاساندرا

کاساندرا یک سیستم انبار‌ه داده ی توزیع‌شده و کاملاً متن باز و رایگان است که برای مدیریت داده های عظیم تولید شده است. کاساندرا این داده ها را در بین سرورهای بسیاری گسترش‌ داده و انعطاف‌پذیری زیادی را برای توزیع داده به شما می‌دهد. همچنین شما می‌توانید ظرفیت نگهدارنده داده‌ی خود ...

ادامه مطلب

خصوصیات سیستم های مدیریت پایگاه داده غیر رابطه ای یا بانک های اطلاعاتی NoSQL

مقایسه کاساندرا با HBase, MongoDB, CouchDB, Neo4j

در سال­های اخیر سیستم ­های نوینی تحت اصطلاح سیستم های مدیریت پایگاه داده غیر رابطه ای یا NoSQL به معنی  “Not Only SQL” یا ” نه تنها SQL” جهت ارائه مقیاس­پذیری افقی برای عملیات توزیع­شده­ی خواندن/نوشتن پایگاه داده برروی چند سرویس­دهنده­، طراحی شده است. در مقابل، محصولات پایگاه­ داده­ی سنتی، ...

ادامه مطلب

خصوصیات کلان داده یا اصل چهار وی (۴V) Volume Velocity Variety Value

کلان داده

کلان داده : تعاریف متعددی در رابطه با کلان داده وجود دارد ولی جامع ترین تعریف را موسسه گارتنر از داده های حجیم ارائه داده است . این تعریف میگوید که داده های حجیم باید سه شرط داشته باشند که به تئوری سه V  معروف است. (البته تئوری چهار V ...

ادامه مطلب