نسل زد (Gen Z) که به طور کلی به افرادی که بین سالهای ۱۹۹۷ تا ۲۰۱۲ میلادی به دنیا آمده اند اطلاق میشود، به عنوان “تکزادگان” یا “بومیان دیجیتال” شناخته میشوند. این نامگذاری به دلیل رشد و پرورش این نسل در دنیای دیجیتال و …
ادامه مطلبداده کاوی (DataMining)
تحلیل احساس و نظرکاوی متون فارسی با یادگیری ماشین و شبکه های عصبی کانولوشنال
داده های متنی یکی از پرمصرف ترینها است که میتواند برای بدست آوردن اطلاعات مهم در موضوعات مختلف مورد استفاده قرار گیرد. رسانه های اجتماعی در اشکال گوناگون خود همانند انجمنها، وبلاگها، میکروبلاگها، سایتهای نظردهی و غیره روزانه منجر به تولید حجم وسیعی از …
ادامه مطلبدیتاست برای تحلیل احساس و تحلیل نیت فارسی (Persian Sentiment Analysis)
وقتی می خواهیم در مورد مسئله ای تصمیم بگیریم، نظر دیگران را درباره ی مسئله ی مورد نظر می پرسیم. در دنیای واقعی، کسب و کارها و سازمان ها به دنبال دانستن نظر مشتریان و عموم مردم در مورد محصولات و سرویس های خود …
ادامه مطلباستخراج کلمات کلیدی از متن فارسی با روش های آماری TF-IDF
بعد از مراحل نرمال سازی، حذف کلمات ایستا، تکه کردن کلمات درون متن و ریشه یابی کردن واژه ها، یکی از مهمترین مراحل در پردازش متن استخراج کلمات کلیدی میباشد. در ابتدا به تعاریفی از کلمات کلیدی یا Key word ها پرداخته میشود. کلمات کلیدی …
ادامه مطلباوسینت (OSINT) چیست؟ جاسوسی مؤدبانه
اوسینت (OSINT)، جمع آوری اطلاعات و کسب نمودن اطلاعات از دنیای پیرامون است که همیشه جذابیت ویژه ای برای انسان ها داشته. گاهی ضرورت ایجاب میکند که اطلاعات خاصی را در مورد سوژه یا موضوع مورد نظز خود به دست آوریم. در این نوشتار …
ادامه مطلبدریاچه داده (Data Lake) چيست و چه تفاوتی با باتلاق داده (Data Swamp) دارد
دریاچه داده (Data Lake) و مفهوم بیگ دیتا دو واژه ناگسستنی هستند به عبارتی Data Lake ظرفی برای نگهداری بیگ دیتا یا کلان داده است که با توجه به گذر زمان ویژگیهای فنی زیادی برای آن شمارده شده است که در ادامه به آن …
ادامه مطلبروش انتخاب مدل یادگیری ماشین و داده کاوی بر اساس معیارهای مختلف
انتخاب مدل مناسب برای داده کاوی و یادگیری ماشین همیشه برای افراد تازه کار در حوزه علم داده، موجب سردرگمی آنها می شود. این موضوع حتی برای افراد با تجربه نیز چالش برانگیز است. در این مطلب کوتاه و کاربردی قصد دارم که یک …
ادامه مطلبایجاد انبارداده(DWH)، دریاچه داده(Data Lake)، بازار داده(Data Mart) و مکعب داده(Data Cube)
داده ها با توجه به حجم و کاربرد آنها در منطق هاي مختلف ذخيره سازي مي شوند که منجر به بوجود آمدن اصطلاحات تخصصي در اين مورد شده است. که هر کدام بار معنايي خودش را به همراه دارد. واژه هايي مثل ديتا ليک، …
ادامه مطلبآپاچی دروید (druid) پایگاه داده ای برای انبارش داده، تحلیل سری زمانی و OLAP
این مبحث شما را با Apache Druid و برخی از ویژگی های اساسی آن آشنا می کند. پس از این مراحل، Druid را نصب میکنید و دادههای نمونه را با استفاده از ویژگی جذب دستهای بومی آن بارگیری میکنید. آپاچی دروید (druid) نیازمندی های …
ادامه مطلبآموزش کامل شبکه عصبی ( artificial neural network) و نحوه استفاده آن
از چند دهه گذشته که رایانهها امکان پیادهسازی الگوریتمهای محاسباتی را فراهم ساختهاند، در راستای شبیهسازی رفتار محاسباتی مغز انسان، کارهای پژوهشی بسیاری از سوی متخصصین علوم رایانه، مهندسین و همچنین ریاضیدانها شروع شده است، که نتایج کار آنها، در شاخهای از علم هوش مصنوعی و در …
ادامه مطلبروش های داده کاوی (Data Mining) به زبان ساده
امروزه داده کاوی به عنوان پایه و مبنای تصمیم های مهم محسوب میشود. داده کاوی به ما کمک میکند که سامانه هایی را توسعه دهیم که قادر است از میان میلیونها یا میلیاردها رکورد، روابط غیر آشکار را شناسایی کند. داده کاوی در حال …
ادامه مطلبطراحی انبار داده و هوش تجاری دو مولفه اصلی برای هوشمندسازی سامانه ها
هدف از ارائه این مبحث آشنایی خواننده با مفاهیم انبار داده Data wareHouse و فن آوری های مرتبط در هوش تجاری (BI) می باشد. انباره های داده، پایه گذار فن آوری لازم برای ساخت و بهره برداری از برنامه های هوشمند هستند. انبار داده …
ادامه مطلبمدل داده ای ستون گرا و تعریف شِمای مبتنی بر ستون در کاساندرا
پایگاه داده های ستون گرا به طور بالقوه می توانند به عنوان یک انبار داده استفاده شوند که قادر است به طور طبیعی پرس و جوهای OLAP را اداره کند. این روش در سال 2012 در مطالعات مختلف ارائه شده است و اکنون محبوبیت …
ادامه مطلبهمه چيز درمورد مکعب داده (Data Cube) و OLAP با مثال عملي
مکعب داده يا OLAP چيست؟ نوع پایگاه داده ای که تراکنش ها را ذخیره می کند، OLTP یا پردازش تراکنش آنلاین نامیده می شود و برای عملیات ساده مانند درج ، به روز رسانی یا حذف یک مورد کاملاً مناسب است. ولي وقتی صحبت …
ادامه مطلبجنگل تصادفي يا رندم فارست چيست و چگونه و در چه مواردي بايد استفاده شود
جنگل تصادفی یا جنگلهای تصمیم تصادفی (Random forest) یک روش یادگیری ترکیبی برای دستهبندی، رگرسیون میباشد، که بر اساس ساختاری متشکل از شمار بسیاری درخت تصمیم، بر روی زمان آموزش و خروجی کلاسها (کلاسبندی) یا برای پیشبینیهای هر درخت به شکل مجزا، کار میکنند. …
ادامه مطلبدرخت تصمیم چیست و چگونه از الگوريتم هاي آن وضعیت آینده را پیشبینی کنیم
اگر میخواهید تا تصمیم پیچیدهای بگیرید و تصمیم دارید تا مسائل را برای خودتان به بخشهای کوچکتری تقسیم کرده تا به شکل بهتری قادر به حل آنها شوید، میتوانید از درخت تصمیم استفاده کنید. درخت تصمیم نقشهای از نتایج احتمالی یکسری از انتخابها متوالی …
ادامه مطلبانواع روش های بصری سازی داده (ِData Visualization) و نحوه انتخاب بهترین نمودار
بصری سازی داده همواره یکی از گام های نهایی تحلیل و یا داده کاوی است. من و شما دادههای زیادی را دررابطهبا شغل خود بررسی میکنیم. اطلاعات مربوط به عملکرد وبسایت، عملکرد فروش، پذیرش محصول، خدمات مشتری، نتایج عملیات بازاریابی و …، این لیست …
ادامه مطلبدانلود فیلم سینمایی درخواست نهایی (margin call) با دوبله فارسی
فیلم سینمایی درخواست نهایی (margin call) موضوع این فیلم داستان شرکتی بسیار بزرگی است که در حال ورشکستگی است ولی مدیران آن از این موضوع بی اطلاع هستند. این شرکت بزرگ مالی، تعدیل نیرو می کند. یکی از قربانیان این رویداد مدیر بخش کنترل …
ادامه مطلبدانلود فیلم سینمایی فرا ماشین (Ex Machina) با دوبله فاسی
فیلم سینمایی فرا ماشین (Ex Machina) این فیلم بسیار جذاب نیز نمونه دیگری از درگیر شدن انسان آن با یک ماشین است. ماشینی که می توان با عشوه گری احساسات یک انسان را مغلوب کند. فیلم سینمایی فرا ماشین (Ex Machina) نمایش می دهد …
ادامه مطلبدانلود مجموعه داده و دیتاست های دیجی کالا (DijiKala)
جهت امور تحقیقیاتی، تحلیل و داده کاوی مجموعه داده و دیتاست های سایت دیجی کالا (DigiKala) برای پژوهشگران آماده شده است. در این صفحه میتوانید dataset دی جی کالا را دانلود کنید. این مجموعه داده شامل موارد زیر است. سفارشات محصولات کامنت ها کیفیت …
ادامه مطلب