آغاز کلان داده در میکروسافت با پشتیبانی پایگاه داده MS-SQLServer از بیگ دیتا
جایگاه کلان داده در میکروسافت
استفاده از Big Data Cluster در SQL Server 2019 باعث هوشمندسازی تمام دادههای کاربر شده و با تلفیق دادههای ساختاریافته و ساختارنیافته در سراسر منطقه داده، به از میان بردن Siloهای داده کمک میکند. این کلاستر، Microsoft SQL Server را با بهترین راهکارهای منبعباز Big Data ادغام میکند و با استفاده از Apache Spark، Containerهای HDFS با Kubernetes و SQL Server بر کلاسترهای مقیاسپذیر اجرا میگردد. همچنین این کلاستر راهکار ایدهآل Big Data برای هوش مصنوعی، ML،M/R ، Streaming، BI، T-SQL و Spark است. با این اتفاق ورود کلان داده در میکروسافت محقق شده است.
شرکتهای مایکروسافت و اینتل در اکتبر 2019 با استفاده از بارهای کاری ناشی از طرح TPC-DS با مجموعههای بزرگ داده، تست عملکرد و مقیاسپذیری را اجرا نمودند. این مجموعههای داده، دادههای خام ساختاریافته و نیمه ساختاریافته به ارزش 1، 10، 30 و 100 ترابایت تولید میکنند که در Big Data Cluster در Microsoft SQL Server 2019 اجرا میشوند.
TPC-DC نخستین معیار استاندارد صنعت در جهان است که برای سنجش عملکرد سیستم پشتیبانی تصمیمگیری (DSS) شامل Queryها و نگهداری از داده طراحی شده است. این معیار متشکل از 99 عدد Query است. با استفاده از Spark SQL، حجم بزرگی از داده را به دقت بررسی کرده و به سوالات کسبوکار موجود در دنیای واقعی پاسخ میدهد. همچنین پیکربندیهای کلاستر را میآزماید تا CPU، حافظه و I/O را همراه با سیستم عامل و راهکار Big Data به بیشترین بازدهی برساند.
برای اجرای تست عملکرد از 2nd Gen Intel Xeon Scalable processors استفاده شده است. Intel® Xeon® Scalable platform برای مدرنسازی مرکز داده طراحی شده تا بازده عملیاتی را که منجر به بهبود هزینه کل مالکیت (TCO) و بهرهوری بالاتر برای کاربران میشود، بالا ببرد.
نتایج استفاده از Big Data Clusters
معیارهای Big Data Cluster که از TC-DC نشات گرفتهاند، مقیاسپذیری و عملکرد رفرنس Big Data Cluster در Microsoft SQL Server را نشان میدهند. تست انجام شده نشان میدهد که عملکرد، مقیاسی خطی از 1 ترابایت تا 100 ترابایت مجموعه داده را به صورت یکدست در بر میگیرد. به این ترتیب منابع متنوع سیستم به گونهای موثر مورد استفاده قرار میگیرند. استفاده از Big Data Cluster درMicrosoft SQL Server 2019، باعث عملکرد بالای پردازنده (Processor)های Intel® Xeon® و Intel® SSDها شده تا بهترین عملکرد را برای Queryهای پیچیده ارائه دهند. به علاوه، نتایج معیار، قابلیت بالای الاستیکی و عملکرد قوی کل پلتفورم را نشان میدهد.
ترکیب Big Data Cluster در Microsoft SQL Server 2019 و Intel’s Xeon Scalable platform میتواند بسیاری از چالشهای Big Data درکسبوکار را مورد توجه و بررسی قرار دهد. میتوان دادهها را از در مقیاس مختلف از منابع متفاوت، در فرمتهای متنوع داده، با محاسبه Scale-Out برای پردازش داده و یادگیری ماشینی، به همراه تجربه پیشتاز SQL Server در صنعت، تجزیه و تحلیل نمود.
منبع:
.https://www.apk.co.ir/blog/big-data-best-performance-with-sql-2019-big-data-clusters/
آدرس کانال تلگرام سایت بیگ دیتا:
آدرس کانال سروش ما:
https://sapp.ir/bigdata_channel
جهت دیدن سرفصل های دوره های آموزشی بر روی اینجا کلیک کنید.
جهت ثبت نام در دوره های آموزشی بر روی اینجا کلیک کنید.
بازدیدها: 1050
برچسبBig Data Big Data Cluster ms sql server SQL سرور اس کیو ال سرور امکانات MS SQL Server بیگ دیتا پایگاه داده داده های حجیم کلاستر کلان داده کلان داده در میکروسافت میکروسافت
همچنین ببینید
پايگاه داده کاساندرا، روش نصب و بررسی نقاط ضعف و قوت
پايگاه داده کاساندرا یک سیستم انباره داده ی توزیعشده و کاملاً متن باز و رایگان …
ایجاد انبارداده(DWH)، دریاچه داده(Data Lake)، بازار داده(Data Mart) و مکعب داده(Data Cube)
داده ها با توجه به حجم و کاربرد آنها در منطق هاي مختلف ذخيره سازي …