خانه --> دیتاست (data set) --> مجموعه داده وسایل و تجهیزات (appliances) جهت متن کاوی

مجموعه داده وسایل و تجهیزات (appliances) جهت متن کاوی

برای تشخیص اینکه یک کلمه اسم است، راه ­های مختلفی وجود دارد که از جمله­ ی آنها مراجعه به لغت نامه، استفاده از وردنت، در نظر گرفتن ریشه ­ی کلمه، استفاده از قواعد نحوی ساخت واژه و غیره می­ باشد. یکی از روش ها مرسوم تشخیص اسم ­ها با استفاده یک لغتنامه از اسامی افراد، مکان­ها، مقادیر عددی و … نوع اسم تشخیص داده می­شود. ولی یک نکته مهم این است که فرهنگ های لغت به این شکل که ما بتوانیم نوع اسامی را تشخیص دهیم تولید نشده اند. یه عنوان مثال در این مبحث مجموعه داده وسایل و تجهیزات برای ما مطلوب است. پس در این جا ما به اسامل تگ خورده نیاز داریم که به عنوان مثال بتوانیم تشخیص بدهیم آیا یک اسم، نام خوراکی است یا نام شهر یا مجموعه داده وسایل است.

تشخیص درست واحدهای اسمی، یک نیاز مهم در حل مسائلی در حوزه‌های جدید مانند پاسخگویی به سوالات، سیستم‌های خلاصه‌سازی، بازیابی اطلاعات، استخراج اطلاعات، ترجمه‌ی ماشینی، تفسیر ویدئویی و جستجوی معنایی در وب است. از جمله نمونه­ های ابزار های انگلیسی تشخیص موجودیت های اسمی (NER)، می­توان به Stanford NER و Illinois NER  اشاره کرد. در فرایند متن کاوی تشخیص موجودیت های اسمی، بعد مراحلی مثل تشخیص زبان، واحدساز، ریشه یابی کلمات و برچسب گذاری انجام می گیرد.

 

مجموعه داده وسایل
مجموعه داده وسایل
مجموعه داده وسایل
مجموعه داده وسایل

آدرس کانال تلگرام سایت بیگ دیتا:

t.me/bigdata_channel

آدرس کانال سروش ما:
https://sapp.ir/bigdata_channel

جهت دیدن سرفصل های دوره های آموزشی بر روی اینجا کلیک کنید.

 

 

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *