خانه بیگ دیتا تحلیل شبکه های اجتماعی، متن کاوی، داده کاوی، اوسینت و داده های حجیم

داده کاوی (DataMining)

دیتاست (DataSet) گراف بیت کوئین

2,347

دیتاست گراف بیت کوئین

دیتاست گراف ارتباطی بیت کوئین: این مجموعه داده مربوط به گراف افرادی معتمد در شبکه امن است که Bitcoin را در پلتفرم Bitcoin Alpha به کار می برند. از آنجا که کاربران Bitcoin ناشناس هستند، نیاز به حفظ رکورد شهرت کاربران برای جلوگیری از …

ادامه مطلب

جستجو در وب تاریک (دارک وب) و وب عمیق (دیپ وب)

86,234

وب تاریک (دارک وب) و وب عمیق (دیپ وب)

نکته مهم (خطر برای تمرین کنندگان): حضور در وب تاریک (دارک وب) و وب عمیق (دیپ وب) حتی برای کنجکاوی می تواند عواقب جبران ناپذیری برای فرد داشته باشد. لذا این پست را صرفا برای افزایش سطح معلومات خود مطالعه کنید و وسوسه ورود …

ادامه مطلب

دانلود ایست واژه‌ها یا Stop Word در زبان فارسی

8,702

ایست واژه‌ها یا Stop Word

ایست واژه‌ها یا Stop Word: کلماتی هستند که با وجود به تکرار بسیار زیاد آن و حضور آنها در اغلب اسناد فاقد اطلاعات معنابخش هستند. بنابراین با حذف آن‌ها کارایی الگوریتم‌ها افزایش و حجم پردازش کاهش می‌یابد. ایست واژه ها لغاتی هستند که علی …

ادامه مطلب

پارس کردن صفحات وب با کتابخانه beautifulsoup پایتون

13,083

پارس کردن صفحات وب با پایتون

معرفی کتابخانه beautifulsoup پایتون : به منظور تجزیه کردن یا پارس کردن صفحات وب با پایتون (فایل های HTML) میتوان از این کتاب خانه استفاده کرد. همچنین از این کتابخانه میتوان برای تجزیه کردن فایل های XML استفاده کرد. مفاهیم کتابخانه beautifulsoup به منظور …

ادامه مطلب

روش جمع آوری اطلاعات از شبکه اجتماعی توئیتر (twitter)

15,051

جمع آوری اطلاعات از توئیتر

یکی از منابع اصلی برای جمع آوری اطلاعات در فضای سایبر شبکه های اجتماعی هستند. شبکه های اجتماعی مختلف از لحاظ جمع آوری اطلاعات درجه اهمیت متفاوتی دارند. این اهمیت با توجه با کشور نوع کشور نیز متغییر است چراکه در برخی از کشورها …

ادامه مطلب

تعریف پیکره واژگان یا WordNet و کاربرد آن

6,371

پیکره واژگان یا WordNet

پیکره واژگان یا WordNet یک مجموعه ی نسبتا بزرگ از لغات و ارتباط آن ها در ساختار متون است. وردنت در حقیقت رابطه معنایی بین دو کلمه را بیان میکند. به عنوان مثال کبوتر از نوع پرنده است و پرنده یک نوع حیوان است …

ادامه مطلب

کتابخانه پایتون برای وب اسکرپ (web scraping)

12,109

پایتون وب اسکرپ

در این مبحث به کتابخانه ی با ارزش پایتون وب اسکرپ (web scraping) به منظور جمع آوری اطلاعات از یک صفحه وب خواهیم پرداخت. همگی میدانیم که یکی از منابع اصلی داده در دنیا امروز، متون و محتوای موجود در سایتهای اینترنتی است. اسکرپ …

ادامه مطلب

خلاصه سازی متن یا summarization در حوزه متن کاوی

8,170

خلاصه سازی متن یا summarization

خلاصه سازی متن یا summarization، فشرده سازی متن به حالت کوتاهتر از متن اصلی است، به طوری که محتوای اطلاعاتی متن و به طور کلی مفاهیم کلی متن حفظ شود. به توجه به اینکه اسناد زیادی در اینترنت موجود است که بیشتر آنها محتوی …

ادامه مطلب

تشخیص موجودیت های اسمی یا نامدار (NER)

6,227

دیتاست اسامی فارسی

فراییند تشخیص موجودیت های اسمی (NER) named entity recognition برای تشخیص اسامی و نوع آنها به کار می رود. تشخیص موجودیت های اسمی فرآیندی است که هدف از آن تشخیص و شناسایی کلمات یا عباراتی است که نمایانگر یک موجودیت میباشند. برای تشخیص موجودیت …

ادامه مطلب

نقش برچسب گذار (POS tagger) در پردازش متن

5,838

برچسب گذار (POS tagger)

یکی از بخش های کلیدی در پردازش متن تعیین نقش کلمه در جمله است. در واقع با ابزار برچسب گذار (POS tagger) نقش کلمه از نظر فعل، فاعل، نوع اسم و غیره مشخص میشود. برچسبگذاری در پردازش زبان بعد از بخش های واحدساز و …

ادامه مطلب

نقش ریشه یاب (Stemmer) در تحلیل متن و پردازش زبان و تفاوت آن با lemmatizer

5,096

ریشه یاب (Stemmer)

در این مبحث مولفه ریشه یاب (Stemmer) در فرایند پردازش متن تشریح می‌گردند. ریشه یابی عبارت است از حذف پس وندها و پیش وند های کلمات و استخراج ریشه آن ها. ریشه یاب (Stemmer) چیست؟ در هر زبان، واژه‌ها با توجه به نقش معنایی و …

ادامه مطلب

نقش واحدساز (Tokenizer) در پردازش متن و متن کاوی

5,034

قطعه بندی متون

واحدساز (Tokenizer) در بخش های قبلی به روش های تشخیص زبان در متون اشاره کردیم در این مبحث به نقش واحد ساز (Tokenizer) در پردازش متن میپردازیم. واحدساز (Tokenizer) مرز کلمات را در متون تشخیص داده و متن را به دنباله‌ای از کلمات تبدیل …

ادامه مطلب

روش‏ هاي تشخيص زبان در متن

4,078

روش‏ هاي تشخيص زبان

تشخیص زبان یک متن، یکی از اولین گام ها به سوی متن کاوی است. مخصوصا در فضای بزرگ سایبر که تنوع بسیار زیادی از داده ها وجود دارد. حتی ممکن است گاهی در اسناد سازمانی هم با تنوع متفاوتی از زبان ها در اسناد …

ادامه مطلب

نمونه برداری گراف شبکه های اجتماعی

3,270

نمونه برداری گراف

شبکه های اجتماعی معمولا شامل تعداد زیادی نود هستند. در نتیجه گراف ناشی از این شبکه‌ها بسیار بزرگ بوده و طبیعتا گرافهای بزرگ این چنینی هزینه پردازش زیادی دارند. در این گونه گرافها حتی الگوریتمهای از مرتبه O(n2) هم دارای پیچیدگی بالایی محسوب میشوند. …

ادامه مطلب

اصطلاحات علمی در حوزه تحلیل شبکه های اجتماعی(terminology)

9,343

اصطلاحات علمی تحلیل شبکه های اجتماعی

اصطلاحات علمی تحلیل شبکه های اجتماعی: ظهور و شناسايي شبکه‌هاي مختلف در پيرامون ما، از شبکه‌ي ژن‌هايي که خصوصياتمان را تعيين مي‌کنند تا شبکه‌هاي اجتماعي برخط که بيشترين بازديدکنندگان در اينترنت را به خود اختصاص داده‌اند، منجر به نام‌گذاري اين عصر به عصر شبکه‌ها …

ادامه مطلب

مقایسه Neo4j با OrientDB با Titan

2,912

مقایسه Neo4j با OrientDB با Titan

در رابطه با مقایسه سه پایگاه داده معروف مبنی بر گراف Neo4j و OrientDB و Titan خصیصه های زیر مورد بررسی قرار گرفته است. هدف کلی این مقایسه بررسی کارایی آن ها است. خصیصه های زیر برای مقایسه انتخاب شده و هر کدام از …

ادامه مطلب

ایندکس معکوس (inverted index) چیست؟

8,363

ایندکس معکوس

در قسمت های قبل روشهای شاخص گذاری بر روی داده ها را بررسی نمودیم. اکنون در بخش ایندکس معکوس (inverted index) مورد مطالعه قرار میدهیم. شاخص گذاري معکوس، يک مکانيزم مبتني بر کلمه است که براي جستجوي سريع اسناد شامل يک کلمه خاص به کار …

ادامه مطلب

محصولات و تکنولوژی های آپاچی (Apache) در حوزه کلان داده و داده کاوی

6,804

تکنولوژی های آپاچی

یکی از موسسات مطرح در زمینه پشتیبانی از داده های حجیم، بنیاد آپاچی می باشد. لذا شناخت محصولات و تکنولوژی های نرم افزاری آپاچی بسیار لازم است. معمولا از مجموعه ی این تکنولوژی ها تحت عنوان اکوسیستم هدوپ یاد میشود. در این مبحث تکنولوژی …

ادامه مطلب

روش تحلیل و پردازش گراف های بزرگ

6,137

پردازش گراف های بزرگ با مپ ردیوس

در قسمت های پیشین با تئوری گراف و تئوری شبکه اجتماعی آشنا شدیم. در این قسمت به روشهای معمول که در پردازش گراف های بزرگ مورد استفاده قرار میگیرد میپردازیم. این موارد را برای این بررسی میکنیم تا در زمان بررسی ابزار ها و …

ادامه مطلب

گرافچی (GraphChi) روشی برای پردازش و تحلیل گرافهای بزرگ

1,815

گرافچی (GraphChi)

گرافچی (GraphChi) روشی برای پردازش و تحلیل گراف های بزرگ بر روی یک کامپیوتر است. این پروژه با سه زبان C, java و Scala بازنویسی شده است. که پروژه اصلی به زبان C است. سیستم های امروزی محاسبات بر روی گراف برای برخورد با …

ادامه مطلب

صفحه 5 از 6اولین «...«2 3 456 »

ما را دنبال کنید

نشانی
email:bigdata724@chmail.ir

Telegram: @bigdata724

آدرس کانال تلگرام ما: t.me/bigdata_channel

برچسب کلمات

مجموعه داده دیتاست کلان داده تحلیل شبکه های اجتماعی گراف کاوی متن کاوی Cassandra جاوا داده کاوی کاساندرا آپاچی Big Data NOSQL بیگ دیتا تحلیل متن data set apache غیر رابطه ای مبتنی بر گراف تحلیل گراف اوسینت داده های حجیم پردازش متن neo4j خانواده ستون دیتا ست یادگیری ماشین جنگ نرم جنگ شناختی ستون گسترده SNA MongoDB بصری سازی گراف پردازش زبان طبیعی
Show More Show Less

کپی برداری صرفا با دادن لینک مستقیم مجاز است.

© Copyright 2025, کلیه حقوق محفوظ است.

گروه تلگرامی داده کاوی و اوسینت

مطالب مفید در حوزه بیگ دیتا و تحلیل شبکه های اجتماعی و داده کاوی

ورود به کانال
Share on Telegram