-
پديد آورنده
يوسفي، روزبهان
-
عنوان
روشي جهت بهبود دقت تشخيص هرزنامه در شبكههاي اجتماعي با استفاده از طبقهبندي هيبريد
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي نرم افزار
-
محل تحصيل
تهران شمال
-
سال تحصيل
1402
-
تاريخ دفاع
تاريخ ثبت در تهران شمال شنبه 1402/9/4
-
وضعيت پايان نامه
صحافي شده ندارد
-
استاد راهنما
بيتا امير شاهي
-
توصيفگر فارسي
روشي جهت بهبود دقت تشخيص هرزنامه در شبكههاي اجتماعي با استفاده از طبقهبندي هيبريد
-
شناسه هاي افزوده
دانشگاه پيام نور مركز تهران شمال
-
چكيده
با افزايش استفاده از اينترنت، افراد به صورت مجازي با استفاده از پلتفرم هاي رسانه هاي اجتماعي مانند پيام هاي متني، فيس بوك، توييتر و غيره براي تبادل اطلاعات به هم متصل مي شوند. گسترش استفاده از شبكه هاي اجتماعي باعث شده تا چالش هايي از قبيل شناسائي هرزنامه ها و جلوگيري از انتشار آنها اهميت يابد. بنابراين، موضوع تشخيص هرزنامه و پيام هاي نامرتبط در شبكه هاي اجتماعي در حال حاضر به عنوان يك موضوع مهم و حياتي از طرف توسعه دهنده پلتفرم شبكه اجتماعي به يك موضوع اساسي تبديل شده است. از اين رو، داشتن يك معماري قوي براي تشخيص هرزنامه كه بتواند از انتشار پيام هاي توهين آميز، پيام هاي تبليغاتي و نامرتبط جلوگيري كند، بسيار مهم است. تشخيص هرزنامه در پلتفرم هاي محبوب با تعداد زيادي كاربر مانند توييتر به دليل متن كوتاه و تنوع زياد در زبان مورد استفاده در رسانه هاي اجتماعي همچنان به عنوان يك چالش در نظر گرفته شده است. در طي سال هاي اخير مدل هاي مختلف هوش مصنوعي و يادگيري ماشين براي تشخيص هرزنامه در شبكه هاي اجتماعي ارائه شده اند، اما بررسي آنها نشان داده كه با افزايش پيچيدگي هاي متني و تنوع هرزنامه ها، استفاده از روش هاي سنتي كارايي مناسبي در حوزه تشخيص هرزنامه نخواهند داشت. در اين پژوهش، يك معماري يادگيري عميق مبتني بر شبكه عصبي پيچشي و حافظه طولاني كوتاه مدت پيشنهاد شده است. در اين پژوهش از الگوريتم شبكه عصبي پيچشي به منظور استخراج و انتخاب ويژگي هاي موثر در تشخيص هرزنامه استفاده مي گردد و سپس با كشف ويژگي ها، فرآيند تشيخص هرزنامه ها در شبكه اجتماعي با استفاده از الگوريتم حافظه طولاني كوتاه مدت انجام ميشود. فرآيند مدل اين پژوهش با معرفي اطلاعات معنايي در بازنمايي كلمات به كمك پايگاههاي دانشي مانند WordNet و Concept Net پشتيباني ميشود. استفاده از اين پايگاه هاي دانش با ارائه نمايش برداري معنايي بهتر كلمات آزمايشي كه قبلاً به دليل ديده نشدن در آموزش داراي ارزش تصادفي بودند، عملكرد را بهبود ميبخشد. نتايج تجربي پيشنهادي روي دو مجموعه داده مربوط به پيامك ها و شبكه اجتماعي توئيتر، براساس معيارهاي مختلف نشان داده كه الگوريتم پيشنهادي براي مجموعه داده پيامك توانسته به دقت (99.01%)، صحت (%98.86)، فراخواني (%99.77) و امتياز F1 (%92.29) دست يابد و براي مجموعه داده توئيتر مقادير دقت، صحت، فراخواني و امتياز F1 به ترتيب برابر 95.48، 95.88، 98.55 و 97.13 درصد شده است. نتايج حاصل از ارزيابي مدل پيشنهادي با ديگر مدلها اثربخشي آن را نسبت به ديگر مدل ها نشان ميدهد.
-
شماره ركورد
74121
-
لينک به اين مدرک :