جو روگان جعلی با استیو جابز قلابی در یک پادکست مبتنی بر هوش مصنوعی مصاحبه می کند


تصویری از سه چهره استیو جابز که توسط هوش مصنوعی ایجاد شده است.
بزرگنمایی کنید / کدام استیو جابز واقعی است؟

Ars Technica

یک شرکت سنتز صدا مستقر در دبی با استفاده از صداهای واقع گرایانه که به صورت دیجیتالی از هر دو مرد شبیه سازی شده بود، یک مصاحبه پادکست خیالی بین جو روگان و استیو جابز منتشر کرد. این در طول “اپیزود اول” یک مجموعه پادکست ادعایی به نام “Podcast.ai” که توسط Play.ht ایجاد شده است، که خدمات سنتز صدا را می فروشد، اتفاق می افتد.

در این مصاحبه، ابتدا صدای روگان را می شنوید که توسط فناوری شبیه سازی صدا ایجاد شده است، مشابه آنچه قبلاً در Ars پوشش داده ایم. فناوری یادگیری عمیق به مدل‌های هوش مصنوعی این امکان را می‌دهد تا صداهای متمایز را با درجه بالایی از دقت تکرار کنند، مانند مورد دارث ویدر در دیزنی. اوبی وان کنوبی سریال تلویزیونی.

برای دستیابی به این اثر، شخصی ابتدا باید مدل هوش مصنوعی را بر روی نمونه‌های موجود از صدایی که شبیه‌سازی می‌شوند، آموزش دهد. روگان یک هدف اصلی برای آموزش صدای هوش مصنوعی توسط مدل های یادگیری عمیق است زیرا مقادیر زیادی از صدای جدا شده او در پادکست های او وجود دارد. در واقع، The Verge یک شیرین کاری روابط عمومی توسط یک شرکت هوش مصنوعی به نام Dessa که Rogan را ترکیب می کند در سال 2019 پوشش داد.

جایی که این نمونه از AI tomfoolery جالب‌تر می‌شود، این است که Play.ht علاوه بر این، صدای استیو جابز، مدیرعامل فقید اپل را به صدا درآورد. صدای او، در حالی که گاهی اوقات به صورت رباتیک متلاطم می شود، سخنرانی های اصلی اپل و مصاحبه های دیجیتال همه چیز را از اواخر دهه 2000 به یاد می آورد. و Play.ht ادعا می کند که متن مصاحبه توسط هوش مصنوعی نیز تولید شده است، احتمالاً از یک مدل زبان بزرگ (LLM) مشابه GPT-3.

Play.ht در وب‌سایت Podcast.ai می‌نویسد: «رونوشت‌ها با مدل‌های زبانی تنظیم‌شده تولید می‌شوند. برای مثال، اپیزود استیو جابز بر اساس بیوگرافی او آموزش داده شده بود و تمام موارد ضبط شده از او را می توانستیم به صورت آنلاین پیدا کنیم تا هوش مصنوعی بتواند به طور دقیق او را به زندگی بازگرداند.

مطابق با ریشه های LLM آن، مصاحبه 19 دقیقه ای چندان منطقی نیست. پس از مدتی، بخش‌هایی از مصاحبه تخیلی مانند ترکیب‌های مفهومی از نکات رایج صحبت‌های جابز، از جمله زیبایی‌شناسی، محصولات انقلابی، رقبایی مانند گوگل، مایکروسافت، و ادوبی و پیروزی‌های مکینتاش اصلی به نظر می‌رسد.

به عنوان مثال، در طول بخشی از مصاحبه، جابز قلابی به انتقاد از مایکروسافت می پردازد که بسیار شبیه آن چیزی است که جابز واقعی در مصاحبه ای معروف در سال 1995 برای او گفت. پیروزی Nerds، اما این یک کپی کربن نیست – و اگر این دو را با هم مقایسه کنید می توانید بگویید که صدا سنتز شده است. جابز جعلی می گوید: «این مشکلی است که من همیشه با مایکروسافت داشتم. “از بسیاری جهات آنها افراد باهوشی هستند و کارهای خوبی انجام داده اند، اما هرگز سلیقه ای نداشته اند. آنها هرگز هیچ حس زیبایی شناسی نداشته اند.”

اینکه آیا استفاده از شباهت های آوازی جابز یا روگان به این شیوه قانونی است یا نه – به ویژه برای تبلیغ یک محصول تجاری – هنوز مشخص نیست. و علی رغم ماهیت شیرین کاری روابط عمومی پادکست، مفهوم پادکست های کاملاً تخیلی افراد مشهور توجه ما را به خود جلب کرد. همانطور که سنتز صدا گسترده تر می شود و به طور بالقوه غیرقابل شناسایی می شود، ما به آینده ای نگاه می کنیم که در آن مصنوعات رسانه ای از هر دوره ای احتمالاً کاملاً روان و انعطاف پذیر هستند و برای هر روایتی قابل شکل گیری هستند. در این دنیای تخیلی خاص، جابز یک طرفدار بزرگ روگان است.

او می‌گوید: «خیلی خوب است که در ماشین بنشینم و به صدای ناله‌های تو گوش کنم.