داده های حجیم (کلان داده)

داده های حجیم (کلان داده)
big data

درآمدی بر اسپارک (Spark) و بررسی معماری و اجزای آن

آپاچی اسپارک

 معماری اسپارک (Spark): این تکنولوژی، چارچوبی با کاربرد همه­ منظوره است و می­توان از آن برای انواع کاربردهای کلان داده، بخصوص شرایطی که سرعت عملیات از اهمیت ویژه­ ای برخوردار باشد، استفاده کرد. دو مثال از این کاربردها، تحلیل تعاملی و اجرای الگوریتم ­های …

ادامه مطلب

انواع ایندکس یا اندیس در پايگاه داده (Index)

انواع ایندکس

انواع ایندکس: از اندیس‌ها می‌توان برای بهبود عملکرد پایگاه‌داده استفاده کرد. اندیس‌ها به سرویس‌دهنده پایگاه‌داده اجازه می‌دهد تا سطرهای خاص را سریع‌تر از حالت بدون اندیس بیابد. در مباحث قبل به ایندکس معکوس و ایندکس ثانویه اشاره شده است. اکنون انواع اصلی که مبانی …

ادامه مطلب

مقایسه OrientDB با Neo4j

مقایسه OrientDB با Neo4j

مقدمه ای بر گراف دیتابیس یک نوع از این پایگاه داده های NOSQL، پایگاه داده های گراف محور یا Graph Based هستند. در مطالب گذشته انواع پایگاه داده های NOSQL را بررسی کردیم. در این مبحث به مقایسه OrientDB با Neo4j می پردازیم. از …

ادامه مطلب

مقایسه داکر (Docker) با VServer و OpenVZ و LXC

مجازی سازی با کانتینر داکر

این روزها، توسعه­ دهندگان نرم ­افزار، شاهد ارز اندام مقتدرانه تکنولوژی کانتینرها هستند. در این بخش، ابتدا مجازی سازی مبتنی بر کانتینر و پیاده ­سازی های آن شرح داده می­شود و سپس، سکوی محبوب داکر (Docker) بصورت ویژه مورد توجه قرار می­گیرد تا بتوانیم …

ادامه مطلب

آموزش کامل نصب و راه اندازی و پیکربندی داکر (Docker) در ویندوز و لینوکس

لایه های داکر

داکر یک ابزار اوپن سورس برای طراحی و ساخت برنامه‌ها به کمک Container است. Container به برنامه نویس کمک می‌کند که پروژه خود را با تمام بخش هایی که دارد (مثل کتابخانه ها، وابستگی‌ها و غیره) به صورت یک پکیج دربیاورد. به لطف این …

ادامه مطلب

مرور و بررسی داکر (Docker) پلت فرم اجرای نرم افزارهای توزیع شده با بهره گیری از ایده کانتینر ها

داکر

معرفی داکر داکر (Docker) یک پروژه متن‌باز است که فرایند استقرار نرم‌افزارها و سرویس‌ها رو با معرفی مفهوم “Container”ها سرعت می‌بخشد. داکر  پروژهٔ متن‌بازی است که توسعه های نرم‌افزارهای کاربردی را درون کانتینر نرم‌افزاری به وسیلهٔ فراهم کردن لایهٔ انتزاعی اضافه‌ای فراهم می‌کند.بعضی از …

ادامه مطلب

نحوه کار و پرسوجو با Neo4j

neo4j GUI

در این بخش به نحوه کار و پرسوجو با بانک اطلاعات مبتنی بر گراف Neo4j میپردازیم. بعد از اجرا Neo4j در ویندوز یا در سیستم عامل لینوکس، در کاوشگر خود آدرس http://localhost:7474 را وارد میکنیم تا رابط کاربری برنامه نمایش داده شود. برای کاربرانی …

ادامه مطلب

نصب و راه اندازی Neo4j (پایگاه داده مبتنی بر گراف ) در سیستم عامل های دبین و ابونتو

neo4j installation

نحوه نصب و راه اندازی Neo4j همانطوره که در پست های قبل اشاره کردم neo4j یک پایگاه داده غیر رابطه ای مبتنی برگراف، برای انجام امور گراف کاوی و داده کاوی است. در این پست به روش نصب و راه اندازی Neo4j خواهیم پرداخت. …

ادامه مطلب

معیار ماژولاریتیmodularity یا پیمانگی با روش Louvain جهت خوشه بندی گراف

ماژولاریتی

پیمانگی Louvain جهت خوشه بندی: پیمانگی (modularity) ابتدا به عنوان معیاری جهت تعیین مرحله توقف الگوریتم گیروان و نیومن مورد توجه بود، ولی به سرعت به جزء پر اهمیت تعداد زیادی از الگوریتم‎های تشخیص انجمن تبدیل شد. این معیار فرمولی برای محاسبه کیفیت تقسیم …

ادامه مطلب

مقایسه کاساندرا با پایگاه داده های غیر رابطه ای HBase, MongoDB, CouchDB, Neo4j

مقایسه کاساندرا با HBase, MongoDB, CouchDB, Neo4j

مقایسه کاساندرا با HBase, MongoDB, CouchDB, Neo4j در این مطالعه در دانشگاه Coimbra پایگاه داده‌های Neo4j، Cassandra، Hbase، MongoDB، OrientDB، و Redis مورد ارزیابی قرار گرفته‌اند. همچنین محققان دانشگاه تورنتو مطالعه‌ای در جهت بررسی عمکرد چندین پایگاه داده NoSQL یک سری آزمایش انجام داده …

ادامه مطلب

قضیه CAP (ویژگیهایConsistency,Partition tolerance,Availability)

,Partition tolerance,Consistency, Availability

قضیه CAP : عبارت CAP ترکیب سرنام مفاهیم زیر است: سازگاری (Consistency): در هنگام توزیع شدگی، بخش‌ها اطلاعات یکسانی را در لحظه داشته باشند. دسترسی‌پذیری (Availability): هر درخواست خواندن و نوشتنی همیشه بدون پاسخ نباشد. تحمل بخش‌ها(Partition tolerance): در هنگام توزیع شدگی هر بخشی …

ادامه مطلب

درآمدی بر بانک های اطلاعاتی غیر رابطه ای (NoSql)

بانک های اطلاعاتی غیر رابطه ای

پایگاه داده های NoSQL ها در واقع همان بانک های اطلاعاتی غیر رابطه ای و توزیع شده هستند که لزوما برای نگهداری داده ها نیازی به ساختار جدول ندارد و میتواند به سادگی عملیات Replication را انجام دهد. البته ایده پایگاه داده NoSQL تقریبا بیش …

ادامه مطلب

خصوصیات سیستم های مدیریت پایگاه داده غیر رابطه ای یا بانک های اطلاعاتی NoSQL

مقایسه کاساندرا با HBase, MongoDB, CouchDB, Neo4j

در سال­های اخیر سیستم ­های نوینی تحت اصطلاح سیستم های مدیریت پایگاه داده غیر رابطه ای یا NoSQL به معنی  “Not Only SQL” یا ” نه تنها SQL” جهت ارائه مقیاس­پذیری افقی برای عملیات توزیع­شده­ی خواندن/نوشتن پایگاه داده برروی چند سرویس­دهنده­، طراحی شده است. …

ادامه مطلب

بخشبندی داده یا partitioning در پایگاه داده غیر رابطه ای کاساندرا

بخشبندی

بخشبندی در پایگاه داده : در این مبحث در مورد قسمت­بند یا بخش بندی (partitioning) کسندرا صحبت خواهیم کرد. قبل از شروع به توضیحات، اشاره ای به مبحث بخش بندی خواهیم نمود. به طور خلاصه وظیفه بخش بند، تقسیم داده ها به صورت تقریبا …

ادامه مطلب

سلام دنیا!

بیگ دیتا

به سایت آموزش پایگاه داده های غیر رابطه ای و کلان داده خوش آمدید.‌ فعالیت ما در رابطه با برگزاری دوره های توانمند سازی و کارگاه های آموزشی در زمینه داده های حجیم یا کلان داده خواهد بود. با ما همراه باشید تا در …

ادامه مطلب