در این پست موارد زیر در رابطه با معیار خرید برای امنیت کلان داده ، بررسی خواهد شد. ▶▶ پرهیز از پیشنهادات امنیت ابرداده ای سطح پایین ▶▶ ایجاد یک چک لیست از معیار …
ادامه مطلباستخراج عبارات کلیدی (KeyPhrase) از متن با روش Ngram
منظور از عبارات کلیدی اسامی ترکیبی هستند که بیانگر معنای واحدی هستند. مثل عبارت “مجلس شورای اسلامی” یا “فرودگاه مهرآباد”. همان طور که میدانید فرایند استخراج عبارات کلیدی با کلمات کلیدی متفاوت است. …
ادامه مطلبیکسان سازی یا نرمال سازی متون فارسی با استفاده از کتابخانه JHazm
در متن کاوی منظور از پردازش زبان طبیعی (NLP)، قابلدسترس کردن زبان طبیعی برای ماشین است. پردازش زبان طبیعی، اسناد متنی بدون ساختار را دریافت و درنهایت به شکلی ساختاریافته تبدیل میکنند. در …
ادامه مطلبتجزیه گر یا پارسر متون و تشخیص زبان با آپاچی تیکا (Apache Tika)
آپاچی تیکا: آپاچی تیکا يکي از پروژههاي متن باز Apache است که کلاسي براي شناسايي زبان متون دارد. Tika براي استخراج متن اصلی از فایل های متنی و تجزیه کردن قسمت های مختلف …
ادامه مطلبآموزش پایگاه داده PostgreSQL (معماری اجزاء و زیر سیستم ها )
مقدمه ای بر دیتابیس PostgreSQL پایگاه داده PostgreSQL یک سیستم پایگاه دادهی ارتباطی شیگرا و منبع باز است که برای اولینبار در سال 1997 با نام “Ingres” ایجاد شد. در اواخر دههی 1990، …
ادامه مطلبآموزش IntelliJ IDEA (قسمت چهارم دی باگ برنامه های جاوا)
دی باگ یا اشکال زدایی اولین برنامه جاوا شما (دیباگ کردن) در این پست روش اشکال زدایی برنامه های جاوا را توصیف می کنیم. IntelliJ IDEA طیف گسترده ای از امکانات را برای …
ادامه مطلبمثالی از داده کاوی و تحلیل گراف خطوط هوایی شبکه جهانی حمل و نقل
در این پست یک تحلیل و بصری سازی خوب از گراف 60،000 پرواز در بین 3,275 فرودگاه جهان توسط 531 خطوط هوایی در 37،153 مسیر یکتا همراه با تحلیل خوشه بندی و تشخیص …
ادامه مطلبتحلیل دینامیک پیگیری انجمن ها (Community Tracking) در شبکه های اجتماعی
پیگیری انجمن ها: با توجه به ساختار جهان هستی و اصالت داشتن رابطهها در آن، گرافها به عنوان ساختارهایی که روابط اشیا با هم را در سطح انتزاع مناسبی نشان میدهند به طور …
ادامه مطلبتحلیل انتشار اطلاعات یا Diffusion در گراف شبکه اجتماعی
یکی از مهمترین فرایندهای دینامیکی در شبکههای اجتماعی و کلاً شبکههای پیچیده، فرایند تحلیل انتشار اطلاعات است. بهطورکلی هر چیزی که بتواند بهصورت فیزیکی یا مجازی میان گرهها جابجا شود میتواند در این …
ادامه مطلبروش محاسبه تعداد کلمات کلیدی (key word) در اسناد متنی
محاسبه تعداد کلمات کلیدی در اسناد متنی بر حسب تعداد کل کلمات هر سند محاسبه تعداد کلمات کلیدی در مطالب قبل به برخی از تکنیک های پردازش متن اشاره کردیم . در این …
ادامه مطلبآموزش IntelliJ IDEA (قسمت سوم ایجاد یک پروژه جدید جاوا)
در مبحث قبل آموزش نصب intellij ارائه شد. این آموزش گردش کار توسعه و ایجاد یک پروژه جدید جاوا با intellij IDEA برای یک برنامه Java SE را نشان می دهد. پس امروز …
ادامه مطلبانواع مجوزها یا لایسنس های مـتن بـاز (Open Source)
عناوين مطالب: 'بخش 1 مقدمه لایسنس های مـتن بـاز (Open Source)بخش 2 مجوزهای متن باز2-1مجوز Public Domain2-2مجوز GFDL2-3 مجوز MIT:2-4مجوز GPL2-5 مجوز LGPL2-7 مجوز PHP2-8 مجوزapple Public Source2-9مدل مجوز MPL2-10مدل مجوز Apache2-11 مجوز …
ادامه مطلبآموزش CytoScape ابزاری برای تحلیل و بصری سازی گراف شبکه
معرفی و آموزش cytoscape در پست های قبل برنامه cytoscape را با نرم افزار گفی مقایسه (اینجا) کردیم. همچنین نرم افزار گفی را (در اینجا) به طور تقریبا کامل آموزش دادیم در این …
ادامه مطلبتغییرات کاساندرا در نسخه های سری 2x و 3x
در نسخه 2 تغییرات کاساندرا بسیار زیادی بوده و حاصل یک پروسه 5 ساله کار بر روی این پایگاه داده می باشد . همچنین بهبودهای آشکاری بر روی کارایی این پایگاه داده مشهود …
ادامه مطلبتشخیص موتیف یا زیر گراف های پرتکرار با برنامه Cytoscape
معرفی موتیف در مطالب قبلی به آموزش Cytoscape پرداختیم در آموزش امروز به نحوه تشخیص موتیف ها در این ابزار می پردازیم. امروزه کشف و تشخیص موتیف در گراف ها بسیار دارای اهمیت …
ادامه مطلبمعرفی DataStax پلتفرمی برای بیگ دیتا و داده کاوی
معرفی DataStax: شرکت دیتا استکس، یک فروشنده نرم افزار های مدیریت داده است و با محصولات پایگاه داده RDBMS از اوراکل رقابت می کند. کارکنان DataStax همکاری کلیدی با پروژه آپاچی کاساندرا منبع …
ادامه مطلبSoNebuntu چیست؟ ابونتو برای تحلیل شبکه های اجتماعی
SoNebuntu چیست؟ SoNebuntu متشکل از کلمات Social Network Ubuntu است و توزیعی برپایه توزیع پر طرفدار ابوتنو میباشد که شامل ابزارهای لازم برای متخصصین، جهت تحلیل شبکههای اجتماعی میباشد. برای انواع کاربردهای مختلف، …
ادامه مطلبElassandra چیست؟ اجتماع پروژه کاساندرا با الاستیک سرچ
الاسندرا چیست ؟ پروژه Elassandra با تلفیق کاساندرا و الستیک سرچ بوجود آماده است. به عبارتی الاسندرا یک انشعاب از Elasticsearch است که به عنوان یک افزونه برای Apache Cassandra در یک معماری …
ادامه مطلبآموزش IntelliJ IDEA (قسمت دوم نصب در لینوکس ابونتو)
آموزش نصب IntelliJ IDEA در لینوکس ابونتو و ویندوز: در بخش قبلی آموزش IntelliJ IDEA به امکانات این ابزار قدرتمند توسعه نرم افزار اشاره کردیم. در این بخش به معرفی نسخه ها و …
ادامه مطلبنحوه اتصال به کاساندرا با جاوا (قسمت اول آشنایی با راه اندازها)
در این بخش، نحوه اتصال به کاساندرا با جاوا بررسی خواهد شد. ابتدا به نحوه ی عملکرد دایور ها یا راه انداز کاساندرا پرداخته خواهد شد و در بخش بعدی مطلب یک مثال …
ادامه مطلب