هوش مصنوعی دارد وعده های زیادی داده شده است، اما چیزی وجود دارد که مانع از استفاده موفقیت آمیز آن توسط میلیاردها نفر شده است: مبارزه ناامید کننده برای انسان ها و ماشین ها برای درک یکدیگر به زبان طبیعی.
این اکنون به لطف ورود مدلهای زبان بزرگ با معماری ترانسفورماتور، یکی از مهمترین پیشرفتهای هوش مصنوعی در 20 سال گذشته، در حال تغییر است.
ترانسفورماتورها شبکههای عصبی هستند که برای مدلسازی دادههای متوالی و ایجاد پیشبینی از آنچه باید در یک سری اتفاق بیفتد، طراحی شدهاند. هسته اصلی موفقیت آنها ایده “توجه” است، که به ترانسفورماتور اجازه می دهد به جای تلاش برای پردازش همه چیز، به برجسته ترین ویژگی های یک ورودی “توجه کند”.
این مدلهای جدید پیشرفتهای قابل توجهی را در برنامههای کاربردی با استفاده از زبان طبیعی مانند ترجمه زبان، خلاصهسازی، بازیابی اطلاعات و مهمتر از همه، تولید متن ارائه کردهاند. در گذشته، هر کدام نیاز به معماری های سفارشی داشتند. اکنون ترانسفورماتورها در حال ارائه نتایج پیشرفته در سراسر صفحه هستند.
اگرچه گوگل در معماری ترانسفورماتور پیشگام بود، OpenAI اولین کسی بود که قدرت خود را در مقیاس بزرگ نشان داد، در سال 2020، با راه اندازی GPT-3 (Generative Pre-trained Transformer 3). در آن زمان، این بزرگترین مدل زبانی بود که تا کنون ساخته شده بود.
توانایی GPT-3 برای تولید متن انسان مانند موجی از هیجان را ایجاد کرد. فقط شروع بود مدل های زبان بزرگ اکنون با سرعتی واقعاً چشمگیر در حال بهبود هستند.
“شمارش پارامتر” به طور کلی به عنوان یک پروکسی تقریبی برای قابلیت های یک مدل پذیرفته شده است. تا کنون، ما شاهد عملکرد بهتر مدلها در طیف وسیعی از وظایف بودهایم که تعداد پارامترها افزایش مییابد. مدلها در پنج سال گذشته تقریباً هر سال رشد کردهاند، بنابراین جای تعجب نیست که نتایج چشمگیر بوده است. با این حال، این مدل های بسیار بزرگ برای خدمت در تولید گران هستند.
آنچه واقعاً قابل توجه است این است که در سال گذشته، آنها کوچکتر و به طور چشمگیری کارآمدتر شده اند. اکنون شاهد عملکرد چشمگیر مدل های کوچکی هستیم که برای اجرا بسیار ارزان تر هستند. بسیاری از آنها منبع باز هستند و موانع آزمایش و به کارگیری این مدل های جدید هوش مصنوعی را کاهش می دهد. البته این بدان معناست که آنها به طور گستردهتری در برنامهها و سرویسهایی که هر روز استفاده میکنید ادغام میشوند.
آنها به طور فزاینده ای قادر خواهند بود متن، تصاویر، محتوای صوتی و ویدئویی با کیفیت بسیار بالا تولید کنند. این موج جدید هوش مصنوعی، کاری را که رایانهها میتوانند برای کاربران خود انجام دهند، بازتعریف میکند و سیلابی از قابلیتهای پیشرفته را در محصولات موجود و کاملاً جدید آزاد میکند.
منطقه ای که من بیشتر در مورد آن هیجان زده هستم، زبان است. در طول تاریخ محاسبات، انسانها مجبور بودهاند افکار خود را با زحمت با استفاده از رابطهایی که برای فناوری طراحی شدهاند، وارد کنند، نه انسانها. با این موج پیشرفت ها، در سال 2023 ما شروع به چت با ماشین های داخل خواهیم کرد ما زبان – به صورت فوری و جامع. در نهایت، ما تعاملات واقعا روان و مکالمه ای با همه دستگاه های خود خواهیم داشت. این نوید می دهد که اساساً تعامل انسان و ماشین را دوباره تعریف کند.
در طول چندین دهه گذشته، ما به درستی بر آموزش نحوه کدنویسی به مردم تمرکز کردهایم – در واقع آموزش زبان رایانهها. این مهم باقی خواهد ماند. اما در سال 2023، ما شروع به ورق زدن آن اسکریپت خواهیم کرد و کامپیوترها به زبان ما صحبت خواهند کرد. این به طور گسترده دسترسی به ابزارهای خلاقیت، یادگیری و بازی را گسترش می دهد.
از آنجایی که هوش مصنوعی در نهایت به عصر کاربردی می رسد، فرصت ها برای محصولات جدید و اولین AI بسیار زیاد است. به زودی، ما در دنیایی زندگی خواهیم کرد که بدون توجه به توانایی های برنامه نویسی شما، محدودیت های اصلی صرفاً کنجکاوی و تخیل است.