دانلود پایان نامه مهندسی کامپیوتر: شناسایی تشکل‌های پنهان بر اساس لینک و محتوا

دانشگاه شیراز

دانشکده برق و کامپیوتر

 

پایان‌نامه کارشناسی ارشد در رشته هوش مصنوعی

شناسایی تشکل‌های پنهان بر اساس لینک و محتوا

 

استاد راهنما:

دکتر ستار هاشمی

 

31 شهریور ماه ۱۳۹3

نام نگارنده و استاد راهنما داخل فایل اصلی موجود است

(در فایل دانلودی نام نویسنده موجود است)

تکه هایی از متن پایان نامه به عنوان نمونه :

(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)

چکیده

امروزه شبکه­های اجتماعی نظیر فیسبوک از محبوبیت زیادی برخوردار شده اند، چرا که به مردم سرتاسر جهان این اجازه را میدهد که بدون تماس فیزیکی، با دوستان خود ارتباط برقرار کرده، برای آنها پیغام گذاشته و نظرات خود را در مورد موضوعات گوناگون بیان کنند. شناسایی تشکل ها در شبکه های اجتماعی کاربرد بسیار زیادی در زمینه های مختلف دارد، بنابراین این موضوع یک زمینه­ی تحقیقاتی بسیار جالب در میان محققان بسیاری از رشته ها است. مطالعات پیشین تنها از اطلاعات ساختاری و لینک­های موجود در شبکه استفاده میکردند و اطلاعات مفید دیگری که در شبکه وجود داشتند مورد غفلت واقع میشدند. در حالی که در بسیاری از شبکه های اجتماعی، داده­های بسیار مفیدی وجود دارد که توسط کاربران تولید می­شوند، نظیر محتوای متن های تولید شده توسط هر کاربر. با قرار دادن این اطلاعات در کنار ساختار لینک شبکه می­توان تعاملات و ارتباطات بین کاربران را تفسیر کرد. در این مطالعه با استفاده از اطلاعات فوق، نشان داده می­شود کاربرانی که لینک های نزدیکی به هم دارند در یک حوزه کاری شبیه به هم قرار می­گیرند. به­طور خاص­تر،در این پژوهش مدلی برای کشف تشکل ها ارائه می­گردد که در ابتدا سعی میکند با استفاده از یک راهکار بیزی تشکل ها را بر اساس ساختار لینک شبکه شناسایی کند. سپس با استفاده از ابزار های پیمایش متنف در صورتی که متن های منتسب به یک کاربر دارای شباهت­های زیادی با عناوین اسناد منتسب به یک تشکل داشته باشد، آن کاربر به تشکل جدید منتقل می­شود. از این رو، افرادی که در یک تشکل مشترک هستند در یک حوزه­ی کاری شبیه به هم نیز قرار دارند. نتایج حکایت از توانایی روش پیشنهادی در کشف تشکل­هایی را دارد که به لحاظ معنایی کاملا معنی دار هستند.

 

 

واژگان کلیدی: شبکه­های اجتماعی، تشکل، شناسایی تشکل ها، پیمایش متن

 

 

 

 

فهرست مطالب

عنوان                                                                                              صفحه

فصل 1- مقدمه.. 7

1-1- شبکه های اجتماعی.. 7

1-2- تقسیمبندی شبکههای اجتماعی.. 9

1-3- اهمیت شبکههای اجتماعی.. 10

1-4- تحلیل شبکههای اجتماعی.. 11

1-5- شبکهها و ویژگی آنها 11

1-6- تشکلها در شبکههای اجتماعی.. 13

1-7- اهمیت شناسایی تشکلها 16

1-8- انگیزه از انجام این پایان نامه. 17

1-9- نگاه کلی به فصول رساله. 19

فصل 2- فصل دوم: مروری بر کارهای انجام شده. 21

2-1- مقدمه. 21

2-2- روشهای ارائه شده 22

2-3- روشهای مبتنی بر لینک… 22

2-3-1- بهینه کردن یک هدف سراسری.. 22

2-3-2- بدون بهینه سازی هیچ معیاری.. 27

2-3-3- روشهای مبتنی بر مدل.. 27

2-4- روشهی مبتنی بر محتوا 29

2-4-1- روش CUT. 29

2-4-2- روش LTCA. 30

فصل 3- ارائه راه حل و روشهای پیشنهادی… 32

3-1- مقدمه. 32

3-2- روش SBM… 34

3-3- روش LDA.. 37

3-4- روش پیشنهادی.. 40

3-4-1- روش CDBLC.. 41

3-5- جمعبندی.. 51

فصل 4- نتایج… 53

4-1- مقدمه. 53

4-2- مجموعه دادهها 54

4-2-1- مجموعه دادهی Cora. 54

4-2-2- مجموعه دادهی Twitter 55

4-3- معیارهای ارزیابی.. 56

4-3-1- معیار Modularity. 57

4-3-2- معیار Normalized Mutual Information. 58

4-3-3- معیار Perplexity. 59

4-4- نتایج و تحلیلها 60

4-4-1- مجموعه دادهی Cora. 61

فصل 5- بحث و نتیجه‌گیری… 67

5-1- نتیجه گیری.. 67

5-2- پیشنهادات برای کارهای آتی.. 71

فهرست منابع.. 72

 

فهرست شکل‌ها

عنوان                                                                                  صفحه

شکل 1-1- تشکلها. 14

شکل2-1- افراز گراف. 25

شکل 2-2-  الف) خوشه‌بندی سلسله مراتبی. ب) خوشه‌بندی توده‌ای.. 26

شکل 2-3- نمایش گرافیکی مدل GSB. 30

شکل 2-4- نمایش گرافیکی روش CUT. 31

شکل 3-1- نمایش گرافیکی روش مدل بلوک تصادفی (SBM). 37

شکل 3-2- نمایش گرافیکی روش LDA. 39

شکل3-3- روند کشف تشکلهای پنهان در CDBLC. 43

شکل 3-4- گراف مبتنی بر لینک برای شبکه مثال. 43

شکل 3-5- اعمال روش SBM بر روی گراف شبکه. 44

شکل 3-6- انتساب اسناد به تشکلها. 45

شکل 3-7- اعمال روش LDA بر روی اسناد درون هر تشکل. 45

شکل 3-8- محاسبه شباهت محتوای اسناد در دیگر تشکلها با عناوین یک تشکل به خصوص. 46

شکل 3-9- همگرایی الگوریتم CDBLC. 47

شکل 3-10- تمایش گرافیکی قدم دوم از الگوریتم CDBLC . 48

شکل 3-11- فلوچارت الگوریتم CDBLC.. 51

…………………………………………………………………………………………………………………………………………………………. 62

شکل 4-1- کارایی الگوریتم با توجه به معیار MI بر روی مجموعه دادهی Cora. 62

شکل 4-2- Perplexity تمام تشکلها در تمام مراحل بر روی مجموعه داده Cora. 63

شکل 4-3- خروجی Perplexity برای هر تشکل در مراحل مختلف بر روی مجموعه داده Cora . 64

شکل 4-4- نمودار مقایسه Perplexity روش LDA و CDBLC برای T=50 و K=5. 65

شکل 4-5- نمودار مقایسه Perplexity روش LDA و CDBLC برای T=30 و K=10. 65

شکل 4-5- نمودار مقایسه Perplexity روش LDA و CDBLC برای T=100 و K=20. 66

فهرست جدول‌ها

عنوان                                                                                 صفحه

جدول 3-1 علائم و تعاریف بکار رفته. 33

فصل 1- مقدمه

1-1- شبکه های اجتماعی

تعامل انسان با کامپیوتر[1] از زمان ایجاد اولین کامپیوتر­ها همواره مورد توجه بوده است و شامل مطالعه، برنامه­ریزی و طراحی رابطه بین کاربران و رایانه­ها است. معمولا از HCI به عنوان نقطه تقاطع علوم کامپیوتر، علوم رفتاری[2]، علم طراحی و چند زمینه دیگر یاد می­شود. این اصطلاح برای اولین بار توسط کارد و همکارانش در کتاب روانشناسی تعامل انسان با کامپیوتر” مطرح شده است و دلالت ضمنی بر این مطلب دارد که رایانه دارای کاربرد­های بیشماری است که بدون مرز بین آن و کاربر اعمال می­شود[1].

متخصصان این حوزه در ابتدا به دنبال راهکاری برای تولید سخت افزار­هایی با ارگونومی مناسب بودند. طی دهه­ی 1980 تمرکز اصلی به تولید نرم افزار های کاربر پسند معطوف شد اما طولی نکشید که در دهه­ی 1990 دیدگاه جدیدی مطرح شد که در آن، به رایانه به عنوان ابزاری برای ایجاد تعاملات انسانی نگاه می­شد. با توجه به این رویکرد، شبکه­های اجتماعی اینترنتی عامل ایجاد تعامل میان انسان­ها در فضای مجازی گشتند و اهمیت به سزایی پیدا کردند[2].

امروزه، با توجه به رشد فراگیر اینترنت و فناوری­های ارتباطی و اطلاعاتی، شاهد شکل گیری یک فضای مجازی در کنار جهان واقعی هستیم  که الگو­های سنتی را دست­خوش تغییر نموده است. این فضا دارای ویژگی­هایی چون فرا­زمان بودن، بی­مکانی، عدم محدودیت به قوانین، روی فضا بودن، آزادی از هویت بدنی و جنسی و برخورداری از فضاهای فرهنگی، اقتصادی، سیاسی است. شبکه­های اجتماعی مجازی، امروزه نقش بسیار مهمی در خلق این فضای مجازی دارند. این فضا­ها در کنار ویژگی­های مثبت، آسیب­های روانی و سیاسی بسیار گسترده­ای را می­توانند برای یک جامعه به همراه بیاورند. همچنین عده­ای از محققان معتقند شبکه­های اجتماعی باعث افزایش معاشرت پذیری می­شود در حالی که عده­ای مقابل این تعریف قرار دارند و معتقدند شبکه اجتماعی فعلی باعث کاهش ارتباط با خانواده می­شود[3].

بنابر تعریف ارائه شده در دانشنامه آزاد ویکی پدیا، شبکه های اجتماعی[3]  ساختار های اجتماعی هستند که از بازیگرانی تشکیل شده اند که به وسیله­ی نوع خاصی از وابستگی مانند روابط دوستی،خویشاوندی، تجاری، الهامات، ایده­ها، لینک­های وب، سرایت بیماری­ها(اپیدمولوژی)، مسیر­هی هواپیمایی یا علایق مشترک با یکدیگر در ارتباط اند. به عبارت دیگر شبکه های اجتماعی مجموعه ای از بازیگران هستند که به نحوی با یکدیگر در ارتباط هستند. در سال های اخیر گسترش استفاده از رسانه­های دیجیتال برای برقراری ارتباط بین افراد، مفهوم شبکه­های اجتماعی به دنیای کامپیوتر راه یافته است و با توجه به زیاد بودن تعداد کاربران در این شبکه­ها، تحلیل آنها به یکی از موضوعات مورد علاقه در اکثر حوزه­ها تبدیل شده است.

به طور معمول شبکه­های اجتماعی را می­توان در قالب گراف[4] نمایش داد که در این گراف­ها، گره[5] ها معادل  کاربران شبکه اجتماعی بوده و یال­[6]های گراف نشان دهنده­ی ارتباط بین بازیگران می­باشند. با توجه به ساختار شبکه اجتماعی و یک طرفه یا دو طرفه بودن ارتباط گراف متناظر می­تواند جهت دار[7] یا بدون جهت[8] باشد. همچنین در صورتی که وزن ارتباط بین افراد در شبکه­های اجتماعی یکسان نباشد گراف متناظر با شبکه یک گراف وزن­دار[9] خواهد بود که در آن وزن هر یال متناظر با وزن ارتباط می­باشد [4].

برای دانلود متن کامل پایان نامه اینجا کلیک کنید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *