آغاز کلان داده در میکروسافت با پشتیبانی پایگاه داده MS-SQLServer از بیگ دیتا

جایگاه کلان داده در میکروسافت

استفاده از Big Data Cluster در SQL Server 2019 باعث هوشمندسازی تمام داده‌های کاربر شده و با تلفیق داده‌های ساختاریافته و ساختارنیافته در سراسر منطقه داده، به از میان بردن Siloهای داده کمک می‌کند. این کلاستر، Microsoft SQL Server را با بهترین راهکارهای منبع‌باز Big Data ادغام می‌کند و با استفاده از Apache Spark، Containerهای HDFS با Kubernetes و SQL Server بر کلاسترهای مقیاس‌پذیر اجرا می‌گردد. ‌همچنین این کلاستر راهکار ایده‌آل Big Data برای هوش مصنوعی، ML،M/R ، Streaming، BI، T-SQL و Spark است. با این اتفاق ورود کلان داده در میکروسافت محقق شده است.

شرکت‌های مایکروسافت و اینتل در اکتبر 2019 با استفاده از بارهای کاری ناشی از طرح TPC-DS با مجموعه‌های بزرگ داده، تست عملکرد و مقیاس‌پذیری را اجرا نمودند. این مجموعه‌های داده، داده‌های خام ساختاریافته و نیمه ساختاریافته به ارزش 1، 10، 30 و 100 ترابایت تولید می‌کنند که در Big Data Cluster در Microsoft SQL Server 2019 اجرا می‌شوند.

TPC-DC نخستین معیار استاندارد صنعت در جهان است که برای سنجش عملکرد سیستم پشتیبانی تصمیم‌گیری (DSS) شامل Queryها و نگهداری از داده طراحی شده است. این معیار متشکل از 99 عدد Query است. با استفاده از Spark SQL، حجم بزرگی از داده را به دقت بررسی کرده و به سوالات کسب‌وکار موجود در دنیای واقعی پاسخ می‌دهد. همچنین پیکربندی‌های کلاستر را می‌آزماید تا CPU، حافظه و I/O را همراه با سیستم عامل و راهکار  Big Data به بیشترین بازدهی برساند.

برای اجرای تست عملکرد از 2nd Gen Intel Xeon Scalable processors استفاده شده است. Intel® Xeon® Scalable platform برای مدرن‌سازی مرکز داده طراحی شده تا بازده عملیاتی را که منجر به بهبود هزینه کل مالکیت (TCO) و بهره‌وری بالاتر برای کاربران می‌شود، بالا ببرد.

نتایج استفاده از Big Data Clusters

معیارهای Big Data Cluster که از TC-DC نشات گرفته‌اند، مقیاس‌پذیری و عملکرد رفرنس Big Data Cluster در Microsoft SQL Server را نشان می‌دهند. تست انجام شده نشان می‌دهد که عملکرد، مقیاسی خطی از 1 ترابایت تا 100 ترابایت مجموعه داده را به صورت یکدست در بر می‌گیرد. به این ترتیب منابع متنوع سیستم به گونه‌ای موثر مورد استفاده قرار می‌گیرند. استفاده از Big Data Cluster درMicrosoft SQL Server 2019، باعث عملکرد بالای پردازنده (Processor)های Intel® Xeon® و Intel® SSDها شده تا بهترین عملکرد را برای Queryهای پیچیده ارائه دهند. به علاوه، نتایج معیار، قابلیت بالای الاستیکی و عملکرد قوی کل پلتفورم را نشان می‌دهد.

ترکیب Big Data Cluster در Microsoft SQL Server 2019 و Intel’s Xeon Scalable platform می‌تواند بسیاری از چالش‌های Big Data درکسب‌وکار را مورد توجه و بررسی قرار دهد. می‌توان داده‌ها را از در مقیاس مختلف از منابع متفاوت، در فرمت‌های متنوع داده، با محاسبه Scale-Out برای پردازش داده و یادگیری ماشینی، به همراه تجربه پیشتاز SQL Server در صنعت، تجزیه و تحلیل نمود.

 

 

 

 

 

کلان داده در میکروسافت
کلان داده در میکروسافت

 

منبع:

.https://www.apk.co.ir/blog/big-data-best-performance-with-sql-2019-big-data-clusters/

برای دیدن فلیم های سینماییِ مهیج و جذاب”در حوزه فناوری اطلاعات، اوسینت و هوش مصنوعی“، بر روی اینجا کلیک کنید.

آدرس کانال تلگرام سایت بیگ دیتا:

t.me/bigdata_channel

آدرس کانال سروش ما:
https://sapp.ir/bigdata_channel

جهت دیدن سرفصل های دوره های آموزشی بر روی اینجا کلیک کنید.

جهت ثبت نام در دوره های آموزشی بر روی اینجا کلیک کنید.

بازدیدها: 1050

همچنین ببینید

پايگاه داده کاساندرا

پايگاه داده کاساندرا، روش نصب و بررسی نقاط ضعف و قوت

پايگاه داده کاساندرا یک سیستم انبار‌ه داده ی توزیع‌شده و کاملاً متن باز و رایگان …

دریاچه داده

ایجاد انبارداده(DWH)، دریاچه داده(Data Lake)، بازار داده(Data Mart) و مکعب داده(Data Cube)

داده ها با توجه به حجم و کاربرد آنها در منطق هاي مختلف ذخيره سازي …

دیدگاهتان را بنویسید