چرا شمارش ربات های توییتر بسیار سخت است؟


حساب‌های خودکار در سال‌های اخیر پیچیده‌تر و پیچیده‌تر شده‌اند. بسیاری از حساب‌های جعلی تا حدی توسط انسان‌ها و همچنین ماشین‌ها اداره می‌شوند، یا فقط پیام‌های نوشته‌شده توسط افراد واقعی را تقویت می‌کنند (چیزی که منچزر «حساب‌های سایبورگ» می‌نامد). حساب‌های دیگر از ترفندهایی استفاده می‌کنند که برای فرار از تشخیص انسانی و الگوریتمی طراحی شده‌اند، مانند لایک کردن و عدم لایک کردن سریع توییت‌ها یا ارسال و حذف توییت‌ها. و البته حساب‌های خودکار یا نیمه خودکار زیادی وجود دارد، مانند حساب‌هایی که توسط بسیاری از شرکت‌ها اداره می‌شوند، که واقعاً مضر نیستند.

الگوریتم Botometer از یادگیری ماشینی برای ارزیابی طیف وسیعی از داده‌های عمومی مرتبط با یک حساب استفاده می‌کند – نه فقط محتوای توییت‌ها، بلکه زمانی که پیام‌ها ارسال می‌شوند، چه کسی یک حساب را دنبال می‌کند و غیره – برای تعیین احتمال ربات بودن آن. . منکزر می‌گوید اگرچه این الگوریتم پیشرفته است، “اکنون بسیاری از حساب‌ها در محدوده‌ای قرار می‌گیرند که الگوریتم اساساً چندان مطمئن نیست.”

Menczer و دیگران می گویند که ربات های لکه بینی بازی موش و گربه است. اما آنها اضافه می کنند که ممکن است در آینده به طور قابل توجهی چالش برانگیزتر شود زیرا ارسال کنندگان هرزنامه از الگوریتم هایی استفاده می کنند که بهتر می توانند متن قانع کننده تولید کنند و مکالمات منسجمی را برگزار کنند.

توییتر خود برای شناسایی ربات‌ها با استفاده از یادگیری ماشین مجهزتر است، زیرا به داده‌های بسیار بیشتری در مورد هر حساب دسترسی دارد. این شامل تاریخچه کامل فعالیت کاربر و همچنین آدرس‌های IP مختلف و دستگاه‌هایی است که استفاده می‌کنند. اما Delip Rao، کارشناس یادگیری ماشینی که از سال 2011 تا 2013 روی تشخیص هرزنامه در توییتر کار می‌کرد، می‌گوید این شرکت ممکن است نتواند نحوه کارکرد این پلتفرم را فاش کند زیرا انجام این کار می‌تواند داده‌های شخصی یا اطلاعاتی را که می‌تواند برای دستکاری توصیه‌های پلتفرم مورد استفاده قرار گیرد فاش کند. سیستم.

این هفته، ماسک همچنین با پاراگ آگراوال، مدیر عامل توییتر، در مورد اینکه این شرکت چگونه می‌تواند روش‌شناسی خود را برای یافتن ربات‌ها فاش کند، درگیر شد. روز دوشنبه، آگراوال یک موضوع ارسال کرد توضیح اینکه چالش هنوز چقدر پیچیده است. او خاطرنشان کرد که داده‌های خصوصی توییتر ممکن است محاسبات مربوط به تعداد ربات‌های این سرویس را تغییر دهد. او در این تاپیک نوشت: «FirstnameBunchOfNumbers بدون عکس نمایه و توییت‌های عجیب و غریب ممکن است برای شما مانند یک ربات یا هرزنامه به نظر برسد، اما در پشت صحنه ما اغلب نشانه‌های متعددی را می‌بینیم که نشان می‌دهد یک شخص واقعی است. آگراوال همچنین گفت که توییتر نمی تواند جزئیات این ارزیابی ها را فاش کند.

اگر توییتر نتواند یا مایل نباشد روش‌شناسی خود را فاش کند و ماسک بگوید بدون جزئیات ادامه نخواهد داد، ممکن است معامله در هاله‌ای از ابهام باقی بماند. البته ماسک از این موضوع به عنوان اهرمی برای مذاکره در مورد کاهش قیمت استفاده می کند.

در حال حاضر، به نظر می رسد ماسک از تلاش های توییتر برای توضیح اینکه چرا یافتن ربات ها آنقدرها هم که او فکر می کند آسان نیست، ناراضی است. او در روز دوشنبه به موضوع طولانی آگراوال پاسخ داد یک پیام ساده برای یک ربات بسیار مناسب تر از خریدار احتمالی توییتر به نظر می رسید: یک ایموجی مدفوع خندان.