دانلود پایان نامه مهندسی کامپیوتر : ارائه یک مدل مبتنی بر خصیصه جهت تحلیل احساس موجود در نوشتجات

 دانشگاه شیراز

دانشکده مهندسی

پایان نامه کارشناسی ارشد در رشته مهندسی کامپیوتر(نرم افزار)

  

ارائه یک مدل مبتنی بر خصیصه جهت تحلیل احساس موجود در نوشتجات

  

استاد راهنما

دکتر سید مصطفی فخراحمد

  

شهریور 1393

نام نگارنده و استاد راهنما داخل فایل اصلی موجود است

(در فایل دانلودی نام نویسنده موجود است)

تکه هایی از متن پایان نامه به عنوان نمونه :

(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)

فهرست مطالب

فصل اول پیشگفتار. 1

1-1- مقدمه. 2

1-3- تحلیل احساس در متن. 6

1-4- اهداف رساله. 8

1-5- روش کار. 9

1-6- ساختار پایان نامه. 9

فصل دوم کارهای انجام شده 10

2-1- مقدمه. 11

2-2- تعریف مسئله. 11

2-3- گام اول تحلیل احساس در متن. 12

2-4- روش‌های مبتنی بر خصیصه‌های N-gram.. 13

2-5- الگوریتم‌های انتخاب خصیصه. 18

فصل سوم روش پیشنهادی. 22

3-1- پیش گفتار. 23

3-2- منابع مورد نیاز. 23

3-3- روش پیشنهادی اول. 25

3-3-1.               پیش پردازش اسناد 26

3-3-2.               برچسب گذاری ادات سخن. 29

3-3-3.               استخراج بردار خصیصه‌ها و ترکیب خصیصه‌ها 30

3-3-4.                اعمال الگوریتم انتخاب خصیصه. 33

3-4- روش پیشنهادی دوم 34

3-5- روش پیشنهادی سوم 37

3-5-1.               استخراج پلاریته کلمات و فیلتر بردار خصیصه. 38

فصل چهارم پیاده سازی و نتایج گرفته شده 47

4-1- مقدمه. 48

4-2- مجموعه داده‌ها 48

4-3- طبقه‌بندی داده‌ها 48

4-4- نتایج روش اول. 49

4-5- نتایج روش دوم 52

4-6- نتایج روش سوم 53

4-7- مقایسه روش پیشنهادی با روش‌های قبل. 53

8-4- نتایج اعمال روش پیشنهادی برای زبان فارسی54

4-9- کارهای آینده 58

مراجع و منابع. 59

 

 

 

 

فهرست الگوریتم ها

Algorithm 1 Documents_To_model. 33

Algorithm 2 Documents_To_model2. 35

Algorithm 3 Polarity_Filter. 40

 

 

 

فهرست تصاویر

شکل 1-1 دسته بندی متون……………………………………………………………………….. 5

شکل 1-2 تحلیلگر احساس در سطح کلمه………………………………………………………… 7

شکل 1-3 تحلیلگر احساس در سطح جمله………………………………………………………… 7

شکل 1-4 تحلیلگر احساس در سطح سند…………………………………………………………. 8

شکل 2-1 مهمترین الگوریتم های انتخاب خصیصه تک متغیره………………………………… 19

شکل 2-2 مهمترین روش های انتخاب خصیصه چند متغیره…………………………………… 21

شکل 3-1 Sentiwordnet………………………………………………………………….. 22

شکل 3-2 شمای کلی روش پیشنهادی اول……………………………………………………… 26

شکل 3-3 شمای پیش پردازش اسناد……………………………………………………………. 27

شکل3-4 برچسب گذار استنفورد………………………………………………………………… 30

شکل3-5 مجموعه خصیصه‌های پیشنهادی برای تحلیل احساس……………………………….. 32

شکل 3-6 شمای کلی روش پیشنهادی دوم……………………………………………………… 36

شکل 3-7 شمای کلی روش سوم………………………………………………………………… 38

 شکل3-8  شمای کلی روش پیشنهادی………………………………………………………….. 43

شکل3-9 برچسب گذار زبان فارسی……………………………………………………………… 44

شکل3-10 مجموعه خصیصه‌های پیشنهادی برای تحلیل احساس متون فارسی………………. 45

 

فهرست جداول

جدول 2-1 مجموعه خصیصه‌ها N-gram و مثال برای هر خصیصه. 15

جدول 2-2 مجموعه کاملی از خصیصه ها N-gram.. 16

جدول 3-1 لیست Stopwords. 28

جدول 3-2 مثال برای رفع ابهام با استفاده از برچسب ادات سخن. 31

جدول 3-3 کلمات هم معنای great. 35

جدول 3-3 محاسبه تفاضل نسبی پلاریتی کلمات. 39

جدول 3-5  مثال خصیصه استخراج شده از متن. 45

جدول 4-1 مجموعه داده های مورد استفاده در این رساله. 49

جدول 4-2 تعداد خصیصه‌های پس از اعمال الگوریتم انتخاب خصیصه. 50

جدول 4-3 مقایسه روش های پیشنهادی. 50

جدول 4-4 مقایسه نتایج روش پیشنهادی با روش پیشین. 52

جدول 4-5 تعداد کل خصیصه ها بدون اعمال الگوریتم انتخاب خصیصه. 53

جدول 4-6 مقایسه نتایج روش پیشنهادی با روش ارائه شده توسط عباسی و همکارانش.. 54

جدول 4-7 مقایسه نتایج روش پیشنهادی با روش ارائه شده توسط آگاروال و میتال. 54

جدول4-8- نتایج طبقه‌بندی متون فارسی. 57

 

 

 

 

 

فصل اول پیشگفتار

 

مقدمه

برخی نویسندگان داده کاوی را به عنوان ابزاری برای جستجو کردن اطلاعات سودمند در حجم زیادی از داده ها تعریف می کنند. برای انجام فرایند داده کاوی با زمینه های گوناگون تحقیقی مواجه می‌شویم، مانند پایگاه داده، یادگیری ماشین و آمار. پایگاه داده‌ها برای تحلیل کردن حجم زیادی از داده‌ها ضروری هستند. یادگیری ماشین، یک ناحیه هوش مصنوعی است که با ایجاد تکنیک‌هایی امکان یادگیری به وسیله تحلیل مجموعه‌های داده‌ای را به کامپیوترها می‌دهند. تمرکز  این روش‌ها روی داده سمبولیک است و با آنالیز داده‌های تجربی سر و کار دارد. پایه آن تئوری آماری است. در این تئوری عدم قطعیت و شانس به وسیله تئوری احتمال مدل می‌شوند. امروزه بسیاری از روش‌های آماری در زمینه داده کاوی استفاده می‌شوند. می‌توان گفت که متن کاوی از تکنیک‌های بازیابی اطلاعات، استخراج اطلاعات همچنین پردازش کردن زبان طبیعی استفاده می‌کند و آن‌ها را به الگوریتم‌ها و متدهای داده کاوی، یادگیری ماشین و آماری مرتبط می‌کند. با توجه به ناحیه‌های تحقیق گوناگون، بر هر یک از آن‌ها می‌توان تعاریف مختلفی از متن کاوی در نظر گرفت در ادامه برخی از این تعاریف بیان می‌شوند:

متن کاوی = استخراج اطلاعات: در این تعریف متن کاوی متناظر با استخراج اطلاعات در نظر گرفته می‌شود (استخراج واقعیت‌ها از متن).

متن کاوی = کشف داده متنی: متن کاوی را می‌توان به عنوان متدها و الگوریتم‌هایی از فیلدهای یادگیری ماشین و آماری برای متن‌ها با هدف پیدا کردن الگوهای مفید در نظر گرفت. برای این هدف پیش پردازش کردن متون ضروری است. در بسیاری از روش‌ها، متدهای استخراج اطلاعات، پردازش کردن زبان طبیعی یا برخی پیش پردازش‌های ساده برای استخراج داده از متون استفاده می‌شود، سپس می‌توان الگوریتم‌های داده کاوی را بر روی داده‌های استخراج شده اعمال کرد.

برای دانلود متن کامل پایان نامه اینجا کلیک کنید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *