پديد آورنده

يوسفي، روزبهان

عنوان

روشي جهت بهبود دقت تشخيص هرزنامه در شبكه‌هاي اجتماعي با استفاده از طبقه‌بندي هيبريد

مقطع تحصيلي

كارشناسي ارشد

رشته تحصيلي

مهندسي نرم افزار

محل تحصيل

تهران شمال

سال تحصيل

1402

تاريخ دفاع

تاريخ ثبت در تهران شمال شنبه 1402/9/4

وضعيت پايان نامه

صحافي شده ندارد

استاد راهنما

بيتا امير شاهي

توصيفگر فارسي

روشي جهت بهبود دقت تشخيص هرزنامه در شبكه‌هاي اجتماعي با استفاده از طبقه‌بندي هيبريد

شناسه هاي افزوده

دانشگاه پيام نور مركز تهران شمال

چكيده

با افزايش استفاده از اينترنت، افراد به صورت مجازي با استفاده از پلتفرم هاي رسانه هاي اجتماعي مانند پيام هاي متني، فيس بوك، توييتر و غيره براي تبادل اطلاعات به هم متصل مي شوند. گسترش استفاده از شبكه هاي اجتماعي باعث شده تا چالش هايي از قبيل شناسائي هرزنامه ها و جلوگيري از انتشار آنها اهميت يابد. بنابراين، موضوع تشخيص هرزنامه و پيام هاي نامرتبط در شبكه هاي اجتماعي در حال حاضر به عنوان يك موضوع مهم و حياتي از طرف توسعه دهنده پلتفرم شبكه اجتماعي به يك موضوع اساسي تبديل شده است. از اين رو، داشتن يك معماري قوي براي تشخيص هرزنامه كه بتواند از انتشار پيام هاي توهين آميز، پيام هاي تبليغاتي و نامرتبط جلوگيري كند، بسيار مهم است. تشخيص هرزنامه در پلتفرم هاي محبوب با تعداد زيادي كاربر مانند توييتر به دليل متن كوتاه و تنوع زياد در زبان مورد استفاده در رسانه هاي اجتماعي همچنان به عنوان يك چالش در نظر گرفته شده است. در طي سال هاي اخير مدل هاي مختلف هوش مصنوعي و يادگيري ماشين براي تشخيص هرزنامه در شبكه هاي اجتماعي ارائه شده اند، اما بررسي آنها نشان داده كه با افزايش پيچيدگي هاي متني و تنوع هرزنامه ها، استفاده از روش هاي سنتي كارايي مناسبي در حوزه تشخيص هرزنامه نخواهند داشت. در اين پژوهش، يك معماري يادگيري عميق مبتني بر شبكه عصبي پيچشي و حافظه طولاني كوتاه مدت پيشنهاد شده است. در اين پژوهش از الگوريتم شبكه عصبي پيچشي به منظور استخراج و انتخاب ويژگي هاي موثر در تشخيص هرزنامه استفاده مي گردد و سپس با كشف ويژگي ها، فرآيند تشيخص هرزنامه ها در شبكه اجتماعي با استفاده از الگوريتم حافظه طولاني كوتاه مدت انجام ميشود. فرآيند مدل اين پژوهش با معرفي اطلاعات معنايي در بازنمايي كلمات به كمك پايگاه‌هاي دانشي مانند WordNet و Concept Net پشتيباني مي‌شود. استفاده از اين پايگاه هاي دانش با ارائه نمايش برداري معنايي بهتر كلمات آزمايشي كه قبلاً به دليل ديده نشدن در آموزش داراي ارزش تصادفي بودند، عملكرد را بهبود مي‌بخشد. نتايج تجربي پيشنهادي روي دو مجموعه داده مربوط به پيامك ها و شبكه اجتماعي توئيتر، براساس معيارهاي مختلف نشان داده كه الگوريتم پيشنهادي براي مجموعه داده پيامك توانسته به دقت (99.01%)، صحت (%98.86)، فراخواني (%99.77) و امتياز F1 (%92.29) دست يابد و براي مجموعه داده توئيتر مقادير دقت، صحت، فراخواني و امتياز F1 به ترتيب برابر 95.48، 95.88، 98.55 و 97.13 درصد شده است. نتايج حاصل از ارزيابي مدل پيشنهادي با ديگر مدل‌ها اثربخشي آن را نسبت به ديگر مدل ها نشان مي‌دهد.

شماره ركورد

74121

لينک به اين مدرک :

https://lib.pnu.ac.ir/dL/search/default.aspx?Term=74121&Field=0&DTC=7