دستیابی به هوش مصنوعی مولد قابل اعتماد | VentureBeat


تمام جلسات درخواستی از اجلاس امنیت هوشمند را در اینجا بررسی کنید.


اصطلاح “هوش مصنوعی مولد” اخیراً سر و صدای زیادی داشته است. هوش مصنوعی مولد انواع مختلفی دارد، اما مشترک همه آنها این است که رایانه می تواند به طور خودکار محتوای هوشمندانه و مفید زیادی را بر اساس ورودی نسبتاً کمی از کاربر تولید کند.

بخش اعظم هیجان اخیر توسط سیستم‌های هوش مصنوعی مولد بصری، مانند DALL·E 2 و Stable Diffusion، که در آنها دستگاه تصاویر جدیدی را بر اساس توضیحات متنی مختصر تولید می‌کند، تقویت شده است. تصویری از “خری روی ماه در حال خواندن تولستوی” را می خواهید؟ وویلا! در عرض چند ثانیه، تصویری از این الاغ خوش‌خوانده و خوش سفر به دست می‌آورید که تا به حال دیده نشده است.

این سیستم ها سرگرمی بی پایانی را ارائه می دهند و نفس گیر هستند. سخت است که این احساس را از بین ببرید که آنها باید باهوش باشند تا نیت شما را درک کنند و به اندازه کافی خلاق باشند تا بر اساس آن یک تصویر بدیع از نظر زیبایی شناختی ایجاد کنند. به علاوه، تبادل ارزش قانع‌کننده‌ای وجود دارد: شما چند کلمه وارد می‌کنید و در عوض، عکسی به ارزش هزاران دریافت می‌کنید. در نهایت، هوش مصنوعی هوشمند، خلاق و مفید!

برخی از حقایق در مورد هوش مصنوعی مولد

اما این گمراه کننده است، زیرا این ایده را تقویت می کند که کامپیوتر تمام کارها را انجام می دهد. اگر واقعاً تنها چیزی که می خواهید تصویر زیبایی شناختی از یک الاغ فرهیخته است، به احتمال زیاد از خروجی راضی خواهید بود. بسیاری از این تصاویر یا بخش‌هایی از آن‌ها وجود دارد و سیستم‌ها به اندازه‌ای خوب هستند که بتوانند یکی را تولید کنند. اما اگر هنرمند هستید، قصد متفاوت تری در ذهن دارید، و در بهترین حالت، از سیستم مولد به عنوان یک ابزار تعاملی برای تولید تصاویر بر اساس بسیاری از اعلان‌هایی که آزمایش می‌کنید استفاده می‌کنید – و احتمالاً پس از آن تصویر را خودتان ماساژ دهید.

رویداد

اجلاس امنیت هوشمند بر حسب تقاضا

نقش حیاتی هوش مصنوعی و ML در امنیت سایبری و مطالعات موردی خاص صنعت را بیاموزید. امروز جلسات درخواستی را تماشا کنید.

اینجا را تماشا کنید

این در مورد هوش مصنوعی مولد متنی حتی قابل توجه تر است – سیستم هایی که در آن ورودی و خروجی هر دو متن هستند. در اینجا نیز، وعده مدل‌هایی مانند GPT-3، آینده‌ای را از ایده‌ها به متن نشان می‌دهد که در آن کاربر برخی از ایده‌های کلیدی را یادداشت می‌کند و سیستم بیشتر کار را بر عهده می‌گیرد و انجام می‌دهد. و در واقع، سیستم های فعلی چشمگیر هستند. آنها شعر می نویسند، پست های وبلاگ، ایمیل، کپی بازاریابی – این لیست ادامه دارد. این سیستم‌ها حتی گاهی اوقات می‌توانند متن طولانی را تولید کنند که به طرز شگفت‌انگیزی منسجم و در پیام است و شامل بسیاری از حقایق صحیح و مرتبط است که در دستورالعمل‌ها ذکر نشده است.

مگر زمانی که این کار را نمی کنند. و اغلب، آنها نمی کنند. در عمل، هوش مصنوعی مولد متنی، وقتی بدون کنترل های مناسب به کار گرفته شود، به همان اندازه که محتوای مفید تولید می کند، مزخرف نیز تولید می کند. بارزترین نمونه اخیر این مورد، Galactica متا بود، که ادعا می‌کرد توانایی تولید محتوای علمی روشن‌فکرانه را دارد، اما پس از دو روز حذف شد، زیرا آشکار شد که به همان اندازه که محتوای علمی معتبر تولید می‌کند، شبه علم نیز تولید می‌کند.

یک کیفیت شکننده

شکنندگی هوش مصنوعی مولد متنی در اوایل تشخیص داده شد. هنگامی که GPT-2 در سال 2019 معرفی شد، ستون نویس تیرنان ری نوشت:[GPT-2 displays] چشمک های درخشندگی مخلوط با […] چرندیات.» و هنگامی که یک سال بعد GPT-3 منتشر شد، همکار من اندرو نگ نوشت: “گاهی اوقات GPT-3 مانند یک مقاله نویس قابل قبول می نویسد. [but] به نظر می رسد بسیار شبیه برخی از شخصیت های عمومی است که با اعتماد به نفس در مورد موضوعاتی که اطلاعات کمی در مورد آنها دارند دفاع می کنند.

مطمئناً ما که در این منطقه کار می کنیم به خوبی از این شکنندگی آگاه بوده ایم. در واقعیت، سیستم‌های مولد متنی، در بهترین حالت، به‌عنوان مولد ایده مورد استفاده قرار می‌گیرند و تخیل نویسنده انسانی را برمی‌انگیزند. همکار من پرسی لیانگ، که با هوش مصنوعی مولد غریبه نیست، گزارش می دهد که از آن در این حالت هنگام نوشتن سخنرانی برای عروسی استفاده کرده است.

اما تکیه بر هوش مصنوعی مولد برای تولید قابل اعتماد متن کامل و نهایی فراتر از قابلیت های سیستم های فعلی است. همانطور که یک ناشر معروف اخیراً از من شکایت کرد، زمانی که شرکت او با استفاده از یک سیستم مولد خاص صرفه جویی کرد، با زمان مورد نیاز برای تعمیر مزخرفات سیستم جبران شد.

تاثیر محدود (تا کنون)

این شکنندگی هوش مصنوعی مولد فعلی تأثیر آن را در دنیای واقعی محدود می کند. برای تحقق کامل پتانسیل خود، هوش مصنوعی مولد – به ویژه نوع متنی آن – باید قابل اعتمادتر شود. چندین پیشرفت فناوری در این زمینه نویدبخش است.

یکی افزایش درجه ای است که خروجی به طور محکم در منابع قابل اعتماد لنگر انداخته است. منظور من از “محکم لنگر انداختن” صرفاً آموزش بر روی منابع قابل اعتماد نیست (که در حال حاضر در سیستم های فعلی یک مشکل وجود دارد)، بلکه همچنین این است که بخش های مهم خروجی را می توان به طور قابل اعتمادی به منابعی که بر اساس آن ها ساخته شده اند ردیابی کرد. به اصطلاح «روش‌های بازیابی» فعلی، که به متن قابل اعتماد برای کمک به هدایت خروجی شبکه عصبی دسترسی دارند، به یک جهت امیدوارکننده اشاره می‌کنند.

عنصر کلیدی دیگر افزایش درجه ای است که سیستم ها عقل سلیم اولیه و استدلال صحیح را نشان می دهند. متن طولانی داستانی را روایت می کند و داستان باید منطق درونی داشته باشد، از نظر واقعیات درست باشد و نکته ای داشته باشد. سیستم های فعلی این کار را نمی کنند.

ماهیت آماری شبکه‌های عصبی که سیستم‌های فعلی را تغذیه می‌کنند، آنها را قادر می‌سازد تا در برخی مواقع گذرگاه‌های مطمئنی ایجاد کنند، اما به ناچار هنگامی که از حد معینی خارج می‌شوند، از صخره سقوط می‌کنند. آنها اشتباهات واقعی یا منطقی فاحشی مرتکب می شوند و به راحتی می توانند از موضوع خارج شوند.

راه حل های عصبی

چندین رشته کار با هدف کاهش این موضوع وجود دارد. آنها شامل رویکردهای کاملاً عصبی هستند، مانند به اصطلاح “تجزیه سریع” و “تولید سلسله مراتبی”. سایر رویکردها از جهت به اصطلاح “عصبی نمادین” پیروی می کنند که ماشین عصبی را با استدلال نمادین صریح تقویت می کند.

اما فکر می‌کنم مهم‌ترین پیشرفت، هماهنگی محصول و تفکر الگوریتمی خواهد بود. وسوسه “به دست آوردن چیزی بیهوده” مردم را به عدم ارائه راهنمایی کافی برای سیستم های مولد و درخواست خروجی بیش از حد جاه طلبانه اغوا می کند.

هوش مصنوعی مولد هرگز کامل نخواهد بود و یک مدیر محصول خوب محدودیت های فناوری زیربنایی را درک می کند. او محصول را برای جبران آن محدودیت ها طراحی می کند و به ویژه بهترین تقسیم کار را بین کاربر و ماشین ایجاد می کند. همانطور که قبلا ذکر شد Galactica در واقع یک مصنوع مهندسی جالب است. اما درخواست از آن برای تولید معتبر مقالات علمی بسیار زیاد است.

هوش مصنوعی مولد به راهنمایی بیشتری نیاز دارد – اگر ندانید به کجا می روید، هرگز به آنجا نخواهید رسید. راهنمایی را می توان از قبل ارائه کرد، مانند مجموعه ای غنی از اعلان ها، اما همچنین به صورت تعاملی در خود محصول.

با نگاه به آینده

هیئت داوران در مورد اینکه کدام ترکیب از تکنیک‌ها مفیدتر است، حضور ندارند، اما من معتقدم که کاستی‌های هوش مصنوعی مولد به‌طور چشمگیری کاهش می‌یابد. من همچنین معتقدم که به دلیل مزایای اقتصادی عظیم هوش مصنوعی مولد متنی قابل اعتماد، این امر زودتر اتفاق خواهد افتاد.

آیا این به معنای پایان نوشتن انسان است؟ من اینطور اعتقاد ندارم. مطمئناً برخی از جنبه های نوشتن خودکار خواهند بود. در حال حاضر، ما نمی توانیم بدون نرم افزار غلط گیر املا و تصحیح دستور زبان زندگی کنیم. ویرایش کپی به صورت خودکار انجام شده است. اما ما همچنان می نویسیم و فکر نمی کنم این تغییر کند.

چیزی که تغییر خواهد کرد این است که، همانطور که ما می نویسیم، دستیاران و ویراستاران داخلی (به معنای ویرایشگر کتاب، نه مصنوع نرم افزار) خواهیم داشت. این کارکردها، که تنها عده قلیلی می توانند از پس آن برآیند، لوکس بوده است، دموکراتیک خواهد شد. و این چیز خوبی است.

Yoav Shoham یکی از بنیانگذاران و یکی از مدیران عامل آزمایشگاه AI21 است.

DataDecisionMakers

به انجمن VentureBeat خوش آمدید!

DataDecisionMakers جایی است که کارشناسان، از جمله افراد فنی که کار داده را انجام می دهند، می توانند بینش ها و نوآوری های مرتبط با داده را به اشتراک بگذارند.

اگر می‌خواهید درباره ایده‌های پیشرفته و اطلاعات به‌روز، بهترین شیوه‌ها و آینده فناوری داده و داده مطالعه کنید، به ما در DataDecisionMakers بپیوندید.

شما حتی ممکن است در نظر داشته باشید که مقاله ای از خودتان ارائه دهید!

از DataDecisionMakers بیشتر بخوانید