تجزیه گر یا پارسر متون و تشخیص زبان با آپاچی تیکا (Apache Tika)

آپاچی تیکا

آپاچی تیکا: آپاچی تیکا يکي از پروژه‌هاي متن باز Apache است که کلاسي براي شناسايي زبان متون دارد. Tika براي استخراج متن اصلی از فایل های متنی و تجزیه کردن قسمت های مختلف فایل با توجه به متا دیتای آن کاربرد دارد. تیکا برای …

ادامه مطلب

آموزش پایگاه داده PostgreSQL (معماری اجزاء و زیر سیستم ها )

پایگاه داده PostgreSQL

مقدمه ای بر دیتابیس PostgreSQL پایگاه داده PostgreSQL یک سیستم پایگاه داده‌ی ارتباطی شی‌گرا و منبع باز است که برای اولین‌بار در سال 1997 با نام “Ingres” ایجاد شد. در اواخر دهه‌ی 1990، Postgre استانداردهای SQL را پذیرفت و نام “PostgreSQL” را اتخاذ کرد. …

ادامه مطلب

مثالی از داده کاوی و تحلیل گراف خطوط هوایی شبکه جهانی حمل و نقل

تحلیل گراف خطوط هوایی

در این پست یک تحلیل و بصری سازی خوب از گراف 60،000 پرواز در بین 3,275 فرودگاه جهان توسط 531 خطوط هوایی در 37،153 مسیر یکتا همراه با تحلیل خوشه بندی و تشخیص Centerality ارائه شده است. هر نود نشان دهنده یک فرودگاه است …

ادامه مطلب

تحلیل دینامیک پیگیری انجمن ها (Community Tracking) در شبکه های اجتماعی

پیگیری انجمن ها

پیگیری انجمن ها: با توجه به ساختار جهان هستی و اصالت داشتن رابطه‌ها در آن، گراف‌ها به عنوان ساختارهایی که روابط اشیا با هم را در سطح انتزاع مناسبی نشان می‌دهند به طور گسترده در مدل‌سازی مسائل مختلف مورد استفاده قرار گرفته‌اند. به همین …

ادامه مطلب

تحلیل انتشار اطلاعات یا Diffusion در گراف شبکه اجتماعی

تحلیل انتشار

یکی از مهم‌ترین فرایندهای دینامیکی در شبکه‌های اجتماعی و کلاً شبکه‌های پیچیده، فرایند تحلیل انتشار اطلاعات است. به‌طورکلی هر چیزی که بتواند به‌صورت فیزیکی یا مجازی میان گره‌ها جابجا شود می‌تواند در این فرایند انتشار مدنظر قرار گیرد. از انتشار بیماری‌های واگیردار ویروسی و …

ادامه مطلب

روش محاسبه تعداد کلمات کلیدی (key word) در اسناد متنی

محاسبه تعداد کلمات کلیدی

محاسبه تعداد کلمات کلیدی در اسناد متنی بر حسب تعداد کل کلمات هر سند محاسبه تعداد کلمات کلیدی در مطالب قبل به برخی از تکنیک های پردازش متن اشاره کردیم . در این مبحث به روش انتخاب تعداد کلمات کلیدی در اسناد متنی میپردازیم. …

ادامه مطلب

انواع مجوزها یا لایسنس های مـتن بـاز (Open Source)

لایسنس های مـتن بـاز (Open Source)

بخش 1 مقدمه لایسنس های مـتن بـاز (Open Source) قبل از آشنایی با لایسنس های مـتن بـاز (Open Source) ، به مقدمه کوتاهی در رابطه با مسائل حقوقی نرم افزار خواهیم پرداخت.  نرم‌افزار به عنوان يکی از محصولات ساخته تفکر انسان محصولی است که …

ادامه مطلب

آموزش CytoScape ابزاری برای تحلیل و بصری سازی گراف شبکه

آموزش CytoScape

معرفی و آموزش cytoscape  در پست های قبل برنامه cytoscape را با نرم افزار گفی مقایسه (اینجا) کردیم. همچنین نرم افزار گفی را (در اینجا) به طور تقریبا کامل آموزش دادیم در این مبحث میخواهیم به آموزش CytoScape بپردازیم. سایتواسکیپ یک نرم افزار برای …

ادامه مطلب

تغییرات کاساندرا در نسخه های سری 2x و 3x

تغییرات کاساندرا

در نسخه 2 تغییرات کاساندرا بسیار زیادی بوده و حاصل یک پروسه 5 ساله کار بر روی این پایگاه داده می باشد . همچنین بهبودهای آشکاری بر روی کارایی این پایگاه داده مشهود است. پیشرفت اصلی در کاساندرا 2 بر روی CQL ، بهبود …

ادامه مطلب

تشخیص موتیف یا زیر گراف های پرتکرار با برنامه Cytoscape

تشخیص موتیف

معرفی موتیف در مطالب قبلی به آموزش Cytoscape پرداختیم در آموزش امروز به نحوه تشخیص موتیف ها در این ابزار می پردازیم. امروزه کشف و تشخیص موتیف در گراف ها بسیار دارای اهمیت هستند. گراف ­ها ساختمان داده­ هاي جهاني هستند. يك گراف مي­تواند …

ادامه مطلب

معرفی DataStax پلتفرمی برای بیگ دیتا و داده کاوی

DataStax چیست؟

معرفی DataStax: شرکت دیتا استکس،  یک فروشنده نرم افزار های مدیریت داده است و با محصولات پایگاه داده RDBMS از اوراکل رقابت می کند. کارکنان DataStax همکاری کلیدی با پروژه آپاچی کاساندرا منبع باز دارند. این شرکت دارای بیش از 400 کارمند و دفاتر …

ادامه مطلب

SoNebuntu چیست؟ ابونتو برای تحلیل شبکه های اجتماعی

SoNebuntu چیست

SoNebuntu چیست؟ SoNebuntu متشکل از کلمات Social Network Ubuntu است و توزیعی برپایه توزیع پر طرفدار ابوتنو می‌باشد که شامل ابزارهای لازم برای متخصصین، جهت تحلیل شبکه‌های اجتماعی می‌باشد. برای انواع کاربردهای مختلف، توزیع‌های مختلفی ایجاد شده است ولی متاسفانه در این زمینه توزیعی …

ادامه مطلب

Elassandra چیست؟ اجتماع پروژه کاساندرا با الاستیک سرچ

الاسندرا چیست

الاسندرا چیست ؟ پروژه Elassandra با تلفیق کاساندرا و الستیک سرچ بوجود آماده است. به عبارتی الاسندرا یک انشعاب از Elasticsearch است که به عنوان یک افزونه برای Apache Cassandra در یک معماری نظیر به نظیر، یکپارچه، قابل مقیاس و انعطاف پذیر عمل می …

ادامه مطلب

نحوه اتصال به کاساندرا با جاوا (قسمت اول آشنایی با راه اندازها)

اتصال به کاساندرا با جاوا

در این بخش، نحوه اتصال به کاساندرا با جاوا بررسی خواهد شد. ابتدا به نحوه ی عملکرد دایور ها یا راه انداز کاساندرا پرداخته خواهد شد و در بخش بعدی مطلب یک مثال کاربردی از اتصال زبان برنامه نویسی جاوا به کاساندرا ارائه می …

ادامه مطلب

آدرس Onion یا پیازی؟ (قسمت3 سرویس‌های مخفی)

سرویس‌های مخفی

«آدرس Onion یا پیازی؟ مسئله این است.» «قسمت ۳» میر سامان تاجبخش دانشجوی ترم آخر دکتری فناوری اطلاعات دانشگاه ارومیه، ارومیه، ایران s.tajbakhsh@chmail.ir ms.tajbakhsh@urmia.ac.ir https://mstajbakhsh.ir شبکه TOR از کاربران مختلف جهت مخفی سازی آدرس IP کاربران استفاده می‌کند. در قسمت اول مجموعه آدرس پیازی، …

ادامه مطلب

مجموعه داده (data set) گراف فیس بوک

مجموعه داده گراف فیس بوک

مجموعه داده گراف فیس بوک: این دیتاست شامل “حلقه ها” (یا “لیست دوستان”) از شبکه اجتماعی فیس بوک است. داده های فیس بوک از شرکت کنندگان بررسی شده با استفاده از یک App فیس بوک جمع آوری شده است. مجموعه داده شامل ویژگی های …

ادامه مطلب