مجموعه داده وسایل و تجهیزات (appliances) جهت متن کاوی

برای تشخیص اینکه یک کلمه اسم است، راه ­های مختلفی وجود دارد که از جمله­ ی آنها مراجعه به لغت نامه، استفاده از وردنت، در نظر گرفتن ریشه ­ی کلمه، استفاده از قواعد نحوی ساخت واژه و غیره می­ باشد. یکی از روش ها مرسوم تشخیص اسم ­ها با استفاده یک لغتنامه از اسامی افراد، مکان­ها، مقادیر عددی و … نوع اسم تشخیص داده می­شود. ولی یک نکته مهم این است که فرهنگ های لغت به این شکل که ما بتوانیم نوع اسامی را تشخیص دهیم تولید نشده اند. یه عنوان مثال در این مبحث مجموعه داده وسایل و تجهیزات برای ما مطلوب است. پس در این جا ما به اسامل تگ خورده نیاز داریم که به عنوان مثال بتوانیم تشخیص بدهیم آیا یک اسم، نام خوراکی است یا نام شهر یا مجموعه داده وسایل است.

تشخیص درست واحدهای اسمی، یک نیاز مهم در حل مسائلی در حوزه‌های جدید مانند پاسخگویی به سوالات، سیستم‌های خلاصه‌سازی، بازیابی اطلاعات، استخراج اطلاعات، ترجمه‌ی ماشینی، تفسیر ویدئویی و جستجوی معنایی در وب است. از جمله نمونه­ های ابزار های انگلیسی تشخیص موجودیت های اسمی (NER)، می­توان به Stanford NER و Illinois NER  اشاره کرد. در فرایند متن کاوی تشخیص موجودیت های اسمی، بعد مراحلی مثل تشخیص زبان، واحدساز، ریشه یابی کلمات و برچسب گذاری انجام می گیرد.

 

مجموعه داده وسایل
مجموعه داده وسایل
مجموعه داده وسایل
مجموعه داده وسایل

آدرس کانال تلگرام سایت بیگ دیتا:

t.me/bigdata_channel

آدرس کانال سروش ما:
https://sapp.ir/bigdata_channel

جهت دیدن سرفصل های دوره های آموزشی بر روی اینجا کلیک کنید.

 

 

بازدیدها: 1325

همچنین ببینید

پیوند معنایی و مجموعه داده های هستان شناسی آنتولوژی فارسی

شناسایی موجودیت های نام دار و ایجاد پیوند معنایی با روش هستان شناسي

آشنایی اولیه ای مقوله پیوند موجودیت های نامدار در مبحث وب معنایی پیوند معنایی موجودیت …

مجموعه داده اشعار حافظ

مجموعه داده (Data Set) اشعار حافظ

معمولا برای هر کار تحلیل در هر حوزه ای به مجموعه داده ی آن حوزه …

دیدگاهتان را بنویسید

گروه تلگرامی اوسینت

مطالب مفید در حوزه بیگ دیتا و تحلیل شبکه های اجتماعی

ورود ----------- انصراف