چکیده بسیاری از برنامه نویسان کار با پایگاه داده های رابطه ای (RDMS) را ترک نموده و به سمت پایگاه داده های گراف متمایل شده اند. Neo4j یکی از محبوب ترین پایگاه داده گرافی (Graph databases) اپن سورس است که امکان مدیریت و کار …
ادامه مطلبپایگاه داده غیر رابطه ای (NOSQL)
دیتاست اسامی فارسی برای تشخیص موجودیت های اسمی
دیتاست اسامی فارسی برای تشخیص موجودیت های اسمی با بیش از چهار هزار کلمه که بر اساس پر استفاده ترین ها مرتب شده اند. یکی از روش های تشخیص موجودیت های نامدار استفاده از دیتاست اسامی فارسی است. این مرتب شدن اسامی به جهت …
ادامه مطلبتغییرات کاساندرا در نسخه های سری 2x و 3x
در نسخه 2 تغییرات کاساندرا بسیار زیادی بوده و حاصل یک پروسه 5 ساله کار بر روی این پایگاه داده می باشد . همچنین بهبودهای آشکاری بر روی کارایی این پایگاه داده مشهود است. پیشرفت اصلی در کاساندرا 2 بر روی CQL ، بهبود …
ادامه مطلبمعرفی DataStax پلتفرمی برای بیگ دیتا و داده کاوی
معرفی DataStax: شرکت دیتا استکس، یک فروشنده نرم افزار های مدیریت داده است و با محصولات پایگاه داده RDBMS از اوراکل رقابت می کند. کارکنان DataStax همکاری کلیدی با پروژه آپاچی کاساندرا منبع باز دارند. این شرکت دارای بیش از 400 کارمند و دفاتر …
ادامه مطلبElassandra چیست؟ اجتماع پروژه کاساندرا با الاستیک سرچ
الاسندرا چیست ؟ پروژه Elassandra با تلفیق کاساندرا و الستیک سرچ بوجود آماده است. به عبارتی الاسندرا یک انشعاب از Elasticsearch است که به عنوان یک افزونه برای Apache Cassandra در یک معماری نظیر به نظیر، یکپارچه، قابل مقیاس و انعطاف پذیر عمل می …
ادامه مطلبآموزش IntelliJ IDEA (قسمت دوم نصب در لینوکس ابونتو)
آموزش نصب IntelliJ IDEA در لینوکس ابونتو و ویندوز: در بخش قبلی آموزش IntelliJ IDEA به امکانات این ابزار قدرتمند توسعه نرم افزار اشاره کردیم. در این بخش به معرفی نسخه ها و نصب آن می پردازیم. نرم افزار Intellij IDEA دارای دو نسخه …
ادامه مطلبنحوه اتصال به کاساندرا با جاوا (قسمت اول آشنایی با راه اندازها)
در این بخش، نحوه اتصال به کاساندرا با جاوا بررسی خواهد شد. ابتدا به نحوه ی عملکرد دایور ها یا راه انداز کاساندرا پرداخته خواهد شد و در بخش بعدی مطلب یک مثال کاربردی از اتصال زبان برنامه نویسی جاوا به کاساندرا ارائه می …
ادامه مطلبپروتکل Gossip یا پروتکل شایعه روشی برای سازگاری سرویس دهنده ها
پروتکل Gossip یا پروتکل شایعه به منظور ارتباط بین ماشین هایی که در کلاستر های مختلف در حال سرویس دهی هستند بکار می رود به جهت اینکه سرویس دهنده ها آخرین وضعیت خود را به دیگران اطلاع دهند و همچنین از آخرین وضعیت دیگر …
ادامه مطلبنصب دستی پایگاه داده کاساندرا از روی فایل فشرده tar.gz
نصب دستی پایگاه داده کاساندرا از این جهت برای ما اهمیت دارد که ممکن است گاهی دسترسی به اینترنت برای نصب خودکار کاساندرا نداشته باشم یا اینکه در مواردی اتصال سرورهای ما به اینترنت مجاز نباشد (که معمولا با این مورد در اکثر پروژه …
ادامه مطلبمعرفی کامل صف پیشرفته کافکا (Kafka) همراه با نصب و راه اندازی در داکر
در مباحث قبل به ActiveMQ به عنوان یک سیستم صف و کارگزار پیام پرداختیم. آپاچی کافکا نیز پلت فرم متن باز به منظور پردازش جریانی اطلاعات توسعه یافته است که توسط بنیاد نرم افزار آپاچی نوشته شده و با اسکالا و جاوا است. این …
ادامه مطلبمقایسه Neo4j با OrientDB با Titan
در رابطه با مقایسه سه پایگاه داده معروف مبنی بر گراف Neo4j و OrientDB و Titan خصیصه های زیر مورد بررسی قرار گرفته است. هدف کلی این مقایسه بررسی کارایی آن ها است. خصیصه های زیر برای مقایسه انتخاب شده و هر کدام از …
ادامه مطلبایندکس معکوس (inverted index) چیست؟
در قسمت های قبل روشهای شاخص گذاری بر روی داده ها را بررسی نمودیم. اکنون در بخش ایندکس معکوس (inverted index) مورد مطالعه قرار میدهیم. شاخص گذاري معکوس، يک مکانيزم مبتني بر کلمه است که براي جستجوي سريع اسناد شامل يک کلمه خاص به کار …
ادامه مطلبمحصولات و تکنولوژی های آپاچی (Apache) در حوزه کلان داده و داده کاوی
یکی از موسسات مطرح در زمینه پشتیبانی از داده های حجیم، بنیاد آپاچی می باشد. لذا شناخت محصولات و تکنولوژی های نرم افزاری آپاچی بسیار لازم است. معمولا از مجموعه ی این تکنولوژی ها تحت عنوان اکوسیستم هدوپ یاد میشود. در این مبحث تکنولوژی …
ادامه مطلبروش تحلیل و پردازش گراف های بزرگ
در قسمت های پیشین با تئوری گراف و تئوری شبکه اجتماعی آشنا شدیم. در این قسمت به روشهای معمول که در پردازش گراف های بزرگ مورد استفاده قرار میگیرد میپردازیم. این موارد را برای این بررسی میکنیم تا در زمان بررسی ابزار ها و …
ادامه مطلبگرافچی (GraphChi) روشی برای پردازش و تحلیل گرافهای بزرگ
گرافچی (GraphChi) روشی برای پردازش و تحلیل گراف های بزرگ بر روی یک کامپیوتر است. این پروژه با سه زبان C, java و Scala بازنویسی شده است. که پروژه اصلی به زبان C است. سیستم های امروزی محاسبات بر روی گراف برای برخورد با …
ادامه مطلبمیزان رشد مشتریان و محبوبیت کاساندرا (Cassandra)
در پست های قبل درباره پایگاه داده NOSQL کاساندرا مطالبی ارائه شد. در این پست به مشتریان کاساندرا و میزان محبوبیت آن میپردازیم. کاساندرا ابتدا در فیس بوک ایجاد شد. ترکیب Big Table و Amazon Dynamo. کاساندرا در بدو تولید به منظور بهبود کارایی …
ادامه مطلببهترین پایگاه داده های مبتنی بر گراف رایگان
پایگاه داده های غیر رابطه ای مبتنی بر گراف یکی از انواع چهارگانه ی NOSQL ها هستند. در زیر ده عدد از بهترین پایگاه داده های مبتنی بر گراف رایگان بر ترتیب محبوبیت آورده شده است. البته دقت داشته باشید که برخی از این …
ادامه مطلبایندکس ثانویه در کاساندرا (شاخص گذاری)
در بخش های قبل در رابطه با روش های ایندکس بر روی داده ها مطالبی ارائه شد و همچنین به بررسی انواع کلید ها و مدل ستون ها در کاساندرا پرداختیم در این مبحث به بررسی ایندکس ثانویه در کاساندرا خواهیم پرداخت. پیشنهاد می …
ادامه مطلبانواع کلید در کاساندرا
کاساندرا تنوع خاص و منحصر به فردی از کلید ها را برای دسترسی به اطلاعات پایگاه داده استفاده میکند. انواع کلید در کاساندرا شامل موارد زیر است. پیشنهاد میشود برای درک بهتر این مطلب قبل از مطالعه این پست، مبحث مربوط به مدل داده …
ادامه مطلبویژگی ACID و BASE در پایگاه داده چیست؟
ویژگی ACID چیست؟ چهار ویژگی اصلی در پایگاه داده که کمک میکند دستورات تراکنش به طور کامل، جامع و بدون تاثیر مخرب بر روی تراکنش ها دیگر و انجام و حفظ شود. تراکنش یک مجموعه ای از عملیات مانند SELECT، UPDATE و… است که …
ادامه مطلب