شکار ربات همه چیز درباره Vibes است


کریستوفر بوزی است سعی کنید جلوتر از ربات ها بمانید. او و تیمش به‌عنوان شخصی که پشت Bot Sentinel، یک سیستم تشخیص ربات محبوب است، مدل‌های یادگیری ماشین خود را از ترس «کهنه شدن» به‌روزرسانی می‌کنند. وظیفه؟ دسته بندی 3.2 میلیون توییت از حساب های تعلیق شده در دو پوشه: “Bot” یا “Not”.

برای شناسایی ربات‌ها، مدل‌های Bot Sentinel ابتدا باید از طریق قرار گرفتن در معرض داده‌ها، رفتار مشکل‌ساز را یاد بگیرند. و با ارائه توییت‌هایی به مدل در دو دسته مجزا – ربات یا غیر ربات – مدل بوزی می‌تواند خود را کالیبره کند و ظاهراً ماهیت چیزی را که او فکر می‌کند یک توییت را مشکل‌ساز می‌کند، بیابد.

داده های آموزشی قلب هر مدل یادگیری ماشینی است. در زمینه رو به رشد تشخیص ربات، نحوه تعریف و برچسب گذاری توییت ها توسط شکارچیان ربات، نحوه تفسیر و طبقه بندی رفتار ربات مانند سیستم های آنها را تعیین می کند. به گفته کارشناسان، این می تواند بیشتر یک هنر باشد تا یک علم. Bouzy می‌گوید: «در پایان روز، زمانی که شما برچسب‌گذاری را انجام می‌دهید، این یک حس و حال است. این فقط در مورد کلمات توییت نیست، زمینه مهم است.

او یک ربات است، او یک ربات است، همه یک ربات هستند

قبل از اینکه کسی بتواند ربات‌ها را شکار کند، باید بفهمد ربات چیست – و این پاسخ بسته به اینکه از چه کسی بپرسید تغییر می‌کند. اینترنت پر از افرادی است که یکدیگر را به دلیل اختلافات سیاسی کوچک به ربات بودن متهم می کنند. به ترول ها ربات می گویند. افرادی که عکس پروفایل ندارند و توییت یا فالوور کمی دارند، ربات نامیده می شوند. حتی در میان شکارچیان ربات های حرفه ای، پاسخ ها متفاوت است.

Bouzy ربات‌ها را به‌عنوان «حساب‌های مشکل‌ساز» تعریف می‌کند و Bot Sentinel را آموزش می‌دهد تا آنها را از بین ببرد. فیلیپو منچزر، استاد انفورماتیک و علوم کامپیوتر دانشگاه ایندیانا، می گوید ابزاری که او به توسعه آن کمک می کند، Botometer، ربات ها را به عنوان حساب هایی تعریف می کند که حداقل تا حدی توسط نرم افزار کنترل می شوند. کاتلین کارلی استاد علوم کامپیوتر در موسسه تحقیقات نرم افزاری در دانشگاه کارنگی ملون است که به توسعه دو ابزار تشخیص ربات کمک کرده است: BotHunter و BotBuster. کارلی ربات را به‌عنوان «اکانتی که با استفاده از نرم‌افزار کاملاً خودکار اجرا می‌شود» تعریف می‌کند، تعریفی که با حساب توییتر مطابقت دارد. این شرکت “ربات یک حساب خودکار است – نه بیشتر یا کمتر.” در یک پست وبلاگ مه 2020 نوشت در مورد دستکاری پلت فرم

همانطور که تعاریف متفاوت است، نتایجی که این ابزارها تولید می کنند همیشه همسو نیستند. برای مثال، حسابی که توسط Botometer به عنوان یک ربات پرچم‌گذاری شده است، ممکن است در Bot Sentinel کاملاً شبیه انسان باشد و بالعکس.

برخی از اینها با طراحی است. برخلاف Botometer که هدف آن شناسایی حساب‌های خودکار یا نیمه خودکار است، Bot Sentinel حساب‌هایی را شکار می‌کند که درگیر ترولینگ سمی هستند. به گفته Bouzy، وقتی این حساب ها را می بینید، آنها را می شناسید. آنها می توانند خودکار یا تحت کنترل انسان باشند و درگیر آزار و اذیت یا اطلاعات نادرست هستند و شرایط خدمات توییتر را نقض می کنند. بوزی می گوید: «فقط بدترین از بدترین ها.

Botometer توسط Kaicheng Yang، کاندیدای دکترای انفورماتیک در رصدخانه رسانه های اجتماعی در دانشگاه ایندیانا که این ابزار را با Menczer ساخته است، نگهداری می شود. این ابزار همچنین از یادگیری ماشینی برای طبقه‌بندی ربات‌ها استفاده می‌کند، اما وقتی یانگ در حال آموزش مدل‌های خود است، لزوماً به دنبال آزار و اذیت یا نقض شرایط خدمات نیست. او فقط به دنبال ربات است. به گفته یانگ، وقتی داده‌های آموزشی خود را برچسب‌گذاری می‌کند، از خود یک سوال می‌پرسد: «آیا من ایمان داشتن توییت از یک شخص می آید یا از یک الگوریتم؟»

چگونه یک الگوریتم را آموزش دهیم

نه تنها در مورد چگونگی تعریف یک ربات اتفاق نظر وجود ندارد، بلکه هیچ معیار یا سیگنال مشخصی وجود ندارد که هر محققی بتواند به درستی پیش‌بینی کند که آیا یک حساب ربات است یا خیر. شکارچیان ربات معتقدند که قرار دادن یک الگوریتم در معرض هزاران یا میلیون ها حساب ربات به رایانه کمک می کند تا رفتار ربات مانند را تشخیص دهد. اما کارایی عینی هر سیستم تشخیص ربات با این واقعیت که انسان ها هنوز باید در مورد اینکه از چه داده هایی برای ساخت آن استفاده کنند قضاوت کنند، مخدوش می شود.

برای مثال Botometer را در نظر بگیرید. یانگ می‌گوید Botometer روی توییت‌های حدود 20000 حساب آموزش داده شده است. در حالی که برخی از این حساب ها خود را به عنوان ربات شناسایی می کنند، اکثر آنها به صورت دستی توسط یانگ و تیمی از محققان قبل از اینکه توسط الگوریتم خرد شوند، دسته بندی می شوند. (Menczer می‌گوید برخی از حساب‌های مورد استفاده برای آموزش Botometer از مجموعه داده‌های سایر تحقیقات بررسی‌شده به دست می‌آیند. ما سعی می‌کنیم از تمام داده‌هایی که می‌توانیم به دستمان برسیم، تا زمانی که از یک منبع معتبر تهیه شده باشد، استفاده کنیم. می گوید.)