یاهو از آشکارساز سوء استفاده آنلاین رونمایی کرد
تیمی از محققان در آزمایشگاه یاهو اعماق بخشهای نظرات عظیم شرکت خود را بررسی کردهاند تا به چیزی دست پیدا کنند که در واقع برای شناسایی و در نهایت مهار سوءاستفادههای گسترده آنلاین مفید باشد.
با استفاده از اولین مجموعه داده در نوع خود ساخته شده از نظرات مقاله توهین آمیز که توسط ویراستاران یاهو پرچم گذاری شده بود، تیم تحقیقاتی توانست الگوریتمی را توسعه دهد که بر اساس بررسی فناوری، بهترین فیلتر خودکار سوء استفاده ساخته شده تا به امروز است.
اکثر فیلترهای سوء استفاده فعلی بر ترکیبی از اصطلاحات در لیست سیاه، عبارات رایج و سرنخهای نحوی برای کشف سخنان نفرتانگیز آنلاین متکی هستند، اما تیم یاهو یک قدم فراتر رفت و یادگیری ماشینی را در مخزن عظیم نظرات پرچمگذاری شده خود اعمال کرد.
با استفاده از تکنیکی به نام “جاسازی کلمه”، که کلمات را بهعنوان بردار پردازش میکند و نه صرفاً مثبت یا منفی، سیستم یاهو میتواند یک رشته توهینآمیز از کلمات را تشخیص دهد، حتی اگر هر یک از کلمات به تنهایی توهینآمیز باشند.
طبق یافتههای آنها، این سیستم در ۹۰ درصد مواقع قادر به تشخیص صحیح زبان توهینآمیز از همان مجموعه دادهها بوده است. در حالی که این رقم قابل توجه است، ماهیت دائماً در حال تغییر سخنان مشوق نفرت به این معناست که هیچ سیستمی – حتی یک سیستم انسانی – هرگز نمی تواند صد در صد موارد توهین آمیز را بداند.
منبع: Financial Turbine