دیتاست ارقام دستنویس فارسی برای یادگیری ماشین

ارقام دستنویس فارسی

بازشناسی ارقام وحروف دستنویس فارسی. موضوعی است که سالهاست روی آن کار میشود چه در حوزه تحقیقات دانشگاهی وچه در حوزه های تجاری وکاربردی.مقالات وپایان نامه های در این زمینه ارئه شده است والبته کارهای صنعتی زیادی هم صورت گرفته است از مهمترین کاربردهای …

ادامه مطلب

آشنایی با پردازش زبان طبیعی استنفورد (Stanford CoreNLP)

پردازش زبان طبیعی استنفورد

Stanford CoreNLP مجموعه ای از ابزارهای آنالیز زبان طبیعی را فراهم می آورد. این نرم افزار می تواند یک متن خام به زبان انگلیسی را به عنوان ورودی گرفته و شکل اولیه کلمات، بخش های گفتاری کلمات، تشخیص اسم خاص بودن کلمات، نرمال کردن …

ادامه مطلب

نحوه اتصال به کاساندرا با جاوا (قسمت دوم برنامه نمونه)

اتصال به cassandra با جاوا

در قسمت اول با درایور یا راه اندازهای کاساندرا نسخه 3 برای اتصال به جاوا آشنا شدیم. در این بخش، نحوه اتصال به cassandra با java با استفاده از راه انداز DataStax بررسی خواهد شد و در ادامه یک مثال کاربردی از اتصال کاساندرا به …

ادامه مطلب

اضافه شدن ویژگی ساسی (SASI) در کاساندرا به منظور Full Search

ساسی (SASI)

نمایه گذاری ساسی (SASI): از نسخه 3.4، می­توان از پیاده­ سازی جدیدی از اندیس­های ثانویه SSTable Attached Secondary Index (SASI) بهره برد. برای ستون­هایی که توسط پیاده­ سازی ساسی (SASI)، اندیس ثانویه می­شوند، می­توان در پرس­وجوها از عملگرهای نامساوی (پرس­وجوی محدوده­ای از مقادیر) و …

ادامه مطلب

قابلیت پالایش داده ها یا Allow Filtering در پایگاه داده ی کاساندرا

قابلیت Allow Filtering در پایگاه داده ی کاساندرا

امروزه تولید کننده های  پایگاه داده های غیر  رابطه ای (nosql) در حال تلاش برای اضافه کردن قابلیت هایی برای افزایش توانمندی های خود هستن.از اندیس‌ها می‌توان برای بهبود عملکرد پایگاه‌داده استفاده کرد. اندیس‌ها به سرویس‌دهنده پایگاه‌داده اجازه می‌دهد تا سطرهای خاص را سریع‌تر …

ادامه مطلب

جوزف نای: مقاله انقلاب اطلاعات و قدرت نرم

جوزف نای

ترجمه مقاله : خلاصه مقاله “انقلاب اطلاعات و قدرت نرم[1]“ نوشته جوزف نای جوزف نای، محقق و سیاستمدار برجسته آمریکایی، مبدع عبارت “قدرت نرم” یا Soft Power می باشد که کتب و مقالات متعددی در خصوص بکارگیری قدرت نرم در مناسبات بین المللی و …

ادامه مطلب

طراحی یک سیستم شناختی برای حمایت از تصمیم گیری در عملیات‌های سایبری

سیستم شناختی

ترجمه مقاله: به سوی یک سیستم شناختی برای حمایت از تصمیم گیری در عملیات‌های سایبری Alessandro Oltramari and Christian Lebiere گروه روانشناسی دانشگاه Carnegie Mellon Pittsburgh، USA پارک علم و فناوری واشنگتن دی سی، ایالات متحده آمریکا بخش اول: خلاصه در این مقاله، الزامات …

ادامه مطلب

پیشبینی ارتباط (لینک) در شبکه گراف های اجتماعی (link prediction)

پیشبینی لینک

پیشبینی لینک وجود ارتباط در شبکه گراف های اجتماعی (link prediction) پیشبینی لینک یا وجود ارتباط میان دو موجودیت بر اساس ویژگی‌های موجودیت‌ها و دیگر لینک‌های مشاهده شده در گراف را پیشبینی لینک[1] می‌گویند . یا به عبارت دیگر اگر در زمان n0  یک …

ادامه مطلب

دانلود مجموعه داده (دیتا ست) اشعار مثنوی معنوی مولوی و دیوان شمس

مجموعه داده مثنوی معنوی

معمولا برای هر کار تحلیل در هر حوزه ای به مجموعه داده ی آن حوزه نیاز میباشد. در این پست مجموعه داده مثنوی معنوی برای انجام پردازش ها و انواع تحلیل های داده کاوی در اختیار قرار گرفته است. از لینک های زیر میتوانید …

ادامه مطلب

شناسایی خودکار حیوانات در تحقیقات حیات وحش با یادگیری ماشین

شناسایی خودکار

شناسایی خودکار حیوانات در تحقیقات حیات وحش یک برنامه جدید که توسط محققان از ایالت پن و مایکروسافت Azure توسعه یافته است، به طور خودکار مناطق مورد علاقه حیوانات در تصاویر را تشخیص می دهد . حین تحقیقات حیات وحش و در پردازش تصاویر …

ادامه مطلب

دانلود مجموعه داده اخبار با طبقه بندی موضوعی (classification)

مجموعه داده اخبار

به منظور استفاده دانشجوبان عزیز در انجام پایان نامه حدود بیست هراز مجموعه داده اخبار با طبقه بندی موضوعی (classification) و خوشه بندی سلسله مراتبی در زیر برای دانلود ارائه شده است. دانلود مجموعه داده اخبار فارسی دسته بندی شده بررسی و مقایسه الگوریتمهای …

ادامه مطلب

مراحل پیش‌پردازش متن خبر فارسی

مراحل پیش‌پردازش

پیش‌پردازش متن فارسی برای پردازش زبان طبیعی و انجام عمليات خودکار بر روي متن مانند ترجمه، خلاصه‌سازي، تصحيح املا، استخراج کلمات کلیدی، خوشه بندی، طبقه بندی و غيره، نيازمند ابزارهايي جهت پيش‌پردازش و آماده‌سازي متون هستيم. پیش پردازش[1] داده ها، مهم‌ترین مرحله در فرایند …

ادامه مطلب

مجموعه داده (Data Set) اشعار حافظ

مجموعه داده اشعار حافظ

معمولا برای هر کار تحلیل در هر حوزه ای به مجموعه داده ی آن حوزه نیاز میباشد. یکی از مشکلات دانشجویان ارشد و دکترا این است که: برای فلان تحقیق (مثلاً درس داده‌کاوی) یا پایان‌نامه، نیاز به یک دیتاست (DataSet = مجموعه داده) دارم، …

ادامه مطلب

دیتاست اخبار حدود چهار هزار خبر فارسی به تفکیک تاریخ

دیتاست اخبار

مجموعه داده اخبار فارسی شامل بیش از سه هزار خبر از خبرگزاری های مختلف است. همه ما روزانه ده ها خبر مطالعه و جستجو می کنیم. دنبال کردن اخبار یکی از عادات روزانه ماست. در این دیتاست اخبار گوناگون جمع آوری شده است. این …

ادامه مطلب

آموزش گیت (Git) بهترین ابزار مدیریت کد

آموزش گیت

مقدمه آموزش گیت در مطالب قبل با پلت فرم توسعه IntelliJ IDEA آشنا شدیم در این پست به آموزش گیت میپردازیم. داشتن ورژن‌های مختلف فایل‌های php, js, css, html و … برنامه، در پروژه‌های فردی و تک‌نفره نیز امری مطلوب به نظر می‌رسد که …

ادامه مطلب

تهدیدهای آینده فناوری اطلاعات و هوش مصنوعی در جنگ نرم و جنگ شناختی

تهدیدهای آینده فناوری اطلاعات

نویسنده علیرضا حبیبی (پژوهشگر) تهدیدهای آینده فناوری اطلاعات از جنس تهدیدات بسیار نرم  برای زندگی ملت ها و حیات دولت هاست که بصورت خزنده از سال ها قبل در حال پشرفت است. به نحوی که در طول دوره عمر متوسط یک انسان معمولا کل …

ادامه مطلب

دانلود مجموعه داده های هستان شناسی(آنتولوژی) فارسی برای لغات هم معنا

پیوند معنایی و مجموعه داده های هستان شناسی آنتولوژی فارسی

هستی‌شناسی، دانش ساختاريافته در مورد يک حوزه خاص است که از طريق ارائه مفاهيم و روابط ميان آنها در آن حوزه شکل می‌گيرد. امروزه، به‌دليل طراحی هستی‌شناسی در حوزه‌های موضوعی مختلف، ارائه معيارهايی برای گزينش مناسب‌ترين هستی‌شناسی، ضروری است. مجموعه داده های هستان شناسی …

ادامه مطلب

گروه تلگرامی اوسینت

مطالب مفید در حوزه بیگ دیتا و تحلیل شبکه های اجتماعی

ورود
انصراف