در پست های قبلی به نصب و راه اندازی پایگاه داده غیر رابطه ای کاساندرا از روی فایل تربال پرداختیم که به صورت خلاصه در زیر اشاره شده است در ادامه به راه اندازی و نصب کسندرا بر روی چند سرور در حالت خوشه …
ادامه مطلبمجموعه داده وسایل و تجهیزات (appliances) جهت متن کاوی
برای تشخیص اینکه یک کلمه اسم است، راه های مختلفی وجود دارد که از جمله ی آنها مراجعه به لغت نامه، استفاده از وردنت، در نظر گرفتن ریشه ی کلمه، استفاده از قواعد نحوی ساخت واژه و غیره می باشد. یکی از روش ها …
ادامه مطلبدیتاست ارقام دست نویس انگلیسی به منظور Machine Learning
MNIST DataSet: این دیتاست شامل 60k تصویر 28×28 اعداد نویس برای آموزش سیستم و 10k تصویر برای تست است. بهترین نتیجه کسب شده برای این داده 99.79% می باشد. دانلود دیتاست ارقام دستنویس انگلیسی هدف این دیتاست در ابتدا دسته بندی انواع مختلف اعداد …
ادامه مطلبدیتاست ارقام دستنویس فارسی برای یادگیری ماشین
بازشناسی ارقام وحروف دستنویس فارسی. موضوعی است که سالهاست روی آن کار میشود چه در حوزه تحقیقات دانشگاهی وچه در حوزه های تجاری وکاربردی.مقالات وپایان نامه های در این زمینه ارئه شده است والبته کارهای صنعتی زیادی هم صورت گرفته است از مهمترین کاربردهای …
ادامه مطلبآشنایی با پردازش زبان طبیعی استنفورد (Stanford CoreNLP)
Stanford CoreNLP مجموعه ای از ابزارهای آنالیز زبان طبیعی را فراهم می آورد. این نرم افزار می تواند یک متن خام به زبان انگلیسی را به عنوان ورودی گرفته و شکل اولیه کلمات، بخش های گفتاری کلمات، تشخیص اسم خاص بودن کلمات، نرمال کردن …
ادامه مطلبنحوه اتصال به کاساندرا با جاوا (قسمت دوم برنامه نمونه)
در قسمت اول با درایور یا راه اندازهای کاساندرا نسخه 3 برای اتصال به جاوا آشنا شدیم. در این بخش، نحوه اتصال به cassandra با java با استفاده از راه انداز DataStax بررسی خواهد شد و در ادامه یک مثال کاربردی از اتصال کاساندرا به …
ادامه مطلباضافه شدن ویژگی ساسی (SASI) در کاساندرا به منظور Full Search
نمایه گذاری ساسی (SASI): از نسخه 3.4، میتوان از پیاده سازی جدیدی از اندیسهای ثانویه SSTable Attached Secondary Index (SASI) بهره برد. برای ستونهایی که توسط پیاده سازی ساسی (SASI)، اندیس ثانویه میشوند، میتوان در پرسوجوها از عملگرهای نامساوی (پرسوجوی محدودهای از مقادیر) و …
ادامه مطلبقابلیت پالایش داده ها یا Allow Filtering در پایگاه داده ی کاساندرا
امروزه تولید کننده های پایگاه داده های غیر رابطه ای (nosql) در حال تلاش برای اضافه کردن قابلیت هایی برای افزایش توانمندی های خود هستن.از اندیسها میتوان برای بهبود عملکرد پایگاهداده استفاده کرد. اندیسها به سرویسدهنده پایگاهداده اجازه میدهد تا سطرهای خاص را سریعتر …
ادامه مطلبویژگی نما های از پیش تولید شده یا Materialized view در کاساندرا
ویژگی ویژیگی نما های از پیش تولید شده در نسخه 3.0 کاساندرا و نسخه های بعدی از آن اضافه شده است. materialized view جدولی است که از داده های جدول دیگری با کلید اصلی و مشخصه های جدید ایجاد میشود. اما materialized view چه …
ادامه مطلبجوزف نای: مقاله انقلاب اطلاعات و قدرت نرم
ترجمه مقاله : خلاصه مقاله “انقلاب اطلاعات و قدرت نرم[1]“ نوشته جوزف نای جوزف نای، محقق و سیاستمدار برجسته آمریکایی، مبدع عبارت “قدرت نرم” یا Soft Power می باشد که کتب و مقالات متعددی در خصوص بکارگیری قدرت نرم در مناسبات بین المللی و …
ادامه مطلبروایت استراتژیک: یک ابزار جدید برای درک قدرت نرم
ترجمه مقابله: روایت استراتژیک یک ابزار جدید برای درک قدرت نرم چکیده : قدرت نرم در شکل فعلی و بسیار شناخته شده خود به یک محدودیت برای افرادی تبدیل شده است که سعی می کنند تا قدرت و ارتباطات را در امور بین المللی …
ادامه مطلبطراحی یک سیستم شناختی برای حمایت از تصمیم گیری در عملیاتهای سایبری
ترجمه مقاله: به سوی یک سیستم شناختی برای حمایت از تصمیم گیری در عملیاتهای سایبری Alessandro Oltramari and Christian Lebiere گروه روانشناسی دانشگاه Carnegie Mellon Pittsburgh، USA پارک علم و فناوری واشنگتن دی سی، ایالات متحده آمریکا بخش اول: خلاصه در این مقاله، الزامات …
ادامه مطلبپیشبینی ارتباط (لینک) در شبکه گراف های اجتماعی (link prediction)
پیشبینی لینک وجود ارتباط در شبکه گراف های اجتماعی (link prediction) پیشبینی لینک یا وجود ارتباط میان دو موجودیت بر اساس ویژگیهای موجودیتها و دیگر لینکهای مشاهده شده در گراف را پیشبینی لینک[1] میگویند . یا به عبارت دیگر اگر در زمان n0 یک …
ادامه مطلبدانلود مجموعه داده (دیتا ست) اشعار مثنوی معنوی مولوی و دیوان شمس
معمولا برای هر کار تحلیل در هر حوزه ای به مجموعه داده ی آن حوزه نیاز میباشد. در این پست مجموعه داده مثنوی معنوی برای انجام پردازش ها و انواع تحلیل های داده کاوی در اختیار قرار گرفته است. از لینک های زیر میتوانید …
ادامه مطلبشناسایی خودکار حیوانات در تحقیقات حیات وحش با یادگیری ماشین
شناسایی خودکار حیوانات در تحقیقات حیات وحش یک برنامه جدید که توسط محققان از ایالت پن و مایکروسافت Azure توسعه یافته است، به طور خودکار مناطق مورد علاقه حیوانات در تصاویر را تشخیص می دهد . حین تحقیقات حیات وحش و در پردازش تصاویر …
ادامه مطلبدانلود مجموعه داده اخبار با طبقه بندی موضوعی (classification)
به منظور استفاده دانشجوبان عزیز در انجام پایان نامه حدود بیست هراز مجموعه داده اخبار با طبقه بندی موضوعی (classification) و خوشه بندی سلسله مراتبی در زیر برای دانلود ارائه شده است. دانلود مجموعه داده اخبار فارسی دسته بندی شده بررسی و مقایسه الگوریتمهای …
ادامه مطلبمراحل پیشپردازش متن خبر فارسی
پیشپردازش متن فارسی برای پردازش زبان طبیعی و انجام عمليات خودکار بر روي متن مانند ترجمه، خلاصهسازي، تصحيح املا، استخراج کلمات کلیدی، خوشه بندی، طبقه بندی و غيره، نيازمند ابزارهايي جهت پيشپردازش و آمادهسازي متون هستيم. پیش پردازش[1] داده ها، مهمترین مرحله در فرایند …
ادامه مطلبمجموعه داده (Data Set) اشعار حافظ
معمولا برای هر کار تحلیل در هر حوزه ای به مجموعه داده ی آن حوزه نیاز میباشد. یکی از مشکلات دانشجویان ارشد و دکترا این است که: برای فلان تحقیق (مثلاً درس دادهکاوی) یا پایاننامه، نیاز به یک دیتاست (DataSet = مجموعه داده) دارم، …
ادامه مطلبدانلود بانک تصاویر گوگل مپ برای زوم های مختلف
خدمات گوگل مپ، تحول بزرگی را در سیستم مسیریابی دنیا به ایجاد کرده است و به معنای واقعی کلمه جهان در جیب شماست را به جهانیان نشان داده است. اطلاعات بسیاری را درباره شهرها و مسیرها تنها با صرف کمی وقت و لمس چند …
ادامه مطلبدیتاست اخبار حدود چهار هزار خبر فارسی به تفکیک تاریخ
مجموعه داده اخبار فارسی شامل بیش از سه هزار خبر از خبرگزاری های مختلف است. همه ما روزانه ده ها خبر مطالعه و جستجو می کنیم. دنبال کردن اخبار یکی از عادات روزانه ماست. در این دیتاست اخبار گوناگون جمع آوری شده است. این …
ادامه مطلب