چگونه با یادگیری ماشینی و هوش مصنوعی شروع کنیم


"کتاب آشپزی است؟!"
بزرگنمایی کنید / “این کتاب آشپزی است؟!”

اوریش لاوسون | گتی ایماژ

«هوش مصنوعی» که امروزه می شناسیم، در بهترین حالت، یک نام اشتباه است. هوش مصنوعی به هیچ وجه هوشمند نیست، اما مصنوعی است. این موضوع یکی از داغ ترین موضوعات در صنعت است و از علاقه مجدد به دانشگاه برخوردار است. این چیز جدیدی نیست – جهان در 50 سال گذشته از طریق یک سری قله ها و دره های هوش مصنوعی پشت سر گذاشته است. اما آنچه که موفقیت‌های فعلی هوش مصنوعی را متفاوت می‌کند این است که سخت‌افزار محاسباتی مدرن در نهایت به اندازه کافی قدرتمند است تا بتواند ایده‌های عجیبی را که مدت‌هاست در اطراف وجود داشته است، به‌طور کامل پیاده‌سازی کند.

در دهه 1950، در اولین روزهایی که امروزه آن را هوش مصنوعی می نامیم، بحث بر سر این بود که چه نامی برای این رشته بگذاریم. هربرت سایمون، یکی از توسعه‌دهندگان ماشین تئوری منطق و حل‌کننده مسائل عمومی، استدلال می‌کند که این زمینه باید نام بسیار ناهنجارتری «پردازش اطلاعات پیچیده» داشته باشد. این مطمئناً هیبتی را که «هوش مصنوعی» ایجاد می‌کند، القا نمی‌کند، و همچنین این ایده را منتقل نمی‌کند که ماشین‌ها می‌توانند مانند انسان فکر کنند.

با این حال، “پردازش اطلاعات پیچیده” توصیف بسیار بهتری از آنچه در واقع هوش مصنوعی است است: تجزیه مجموعه داده های پیچیده و تلاش برای استنتاج از انبوه. برخی از نمونه‌های مدرن هوش مصنوعی شامل تشخیص گفتار (به شکل دستیارهای مجازی مانند سیری یا الکسا) و سیستم‌هایی هستند که تعیین می‌کنند در یک عکس چه چیزی وجود دارد یا توصیه می‌کنند چه چیزی بخرید یا تماشا کنید. هیچ یک از این نمونه ها قابل مقایسه با هوش انسان نیستند، اما نشان می دهند که ما می توانیم با پردازش اطلاعات کافی کارهای قابل توجهی انجام دهیم.

اینکه ما از این زمینه به عنوان «پردازش اطلاعات پیچیده» یا «هوش مصنوعی» (یا «یادگیری ماشینی» به شکل شوم اسکای نت) یاد کنیم، بی ربط است. حجم عظیمی از کار و نبوغ انسانی برای ساخت برنامه های کاملاً باورنکردنی انجام شده است. به عنوان مثال، به GPT-3 نگاه کنید، یک مدل یادگیری عمیق برای زبان‌های طبیعی که می‌تواند متنی را تولید کند که از متن نوشته شده توسط یک شخص قابل تشخیص نیست (اما می‌تواند به طرز خنده‌داری اشتباه کند). این مدل توسط یک مدل شبکه عصبی پشتیبانی می شود که از بیش از 170 میلیارد پارامتر برای مدل سازی زبان انسان استفاده می کند.

ابزاری به نام Dall-E بر روی GPT-3 ساخته شده است که تصویری از هر چیز خارق العاده ای را که کاربر درخواست می کند تولید می کند. نسخه به روز شده 2022 ابزار، Dall-E 2، به شما امکان می دهد حتی فراتر بروید، زیرا می تواند سبک ها و مفاهیم کاملاً انتزاعی را “درک” کند. به عنوان مثال، درخواست از Dall-E برای تجسم “فضانوردی سوار بر اسب به سبک اندی وارهول” تعدادی تصویر مانند این را ایجاد می کند:

بزرگنمایی کنید / “فضانوردی سوار بر اسب به سبک اندی وارهول”، تصویری که توسط Dall-E با هوش مصنوعی تولید شده است.

Dall-E 2 برای یافتن تصویر مشابه، جستجوی گوگل را انجام نمی دهد. بر اساس مدل داخلی خود یک تصویر ایجاد می کند. این یک تصویر جدید است که از چیزی جز ریاضی ساخته شده است.

همه کاربردهای هوش مصنوعی به این اندازه پیشگامانه نیستند. هوش مصنوعی و یادگیری ماشین تقریباً در هر صنعتی کاربرد دارند. یادگیری ماشینی به سرعت در بسیاری از صنایع تبدیل به یک امر ضروری می شود و همه چیز را از موتورهای توصیه در بخش خرده فروشی گرفته تا ایمنی خطوط لوله در صنعت نفت و گاز و تشخیص و حفظ حریم خصوصی بیماران در صنعت مراقبت های بهداشتی را تامین می کند. هر شرکتی منابع لازم برای ایجاد ابزارهایی مانند Dall-E را از ابتدا ندارد، بنابراین تقاضای زیادی برای مجموعه ابزارهای مقرون به صرفه و قابل دسترس وجود دارد. چالش پر کردن این تقاضا مشابه با روزهای اولیه محاسبات تجاری است، زمانی که کامپیوترها و برنامه های کامپیوتری به سرعت در حال تبدیل شدن بودند. را کسب و کارهای فناوری مورد نیاز است. در حالی که همه نیازی به توسعه زبان برنامه نویسی بعدی یا سیستم عامل ندارند، بسیاری از شرکت ها می خواهند از قدرت این رشته های تحصیلی جدید استفاده کنند و به ابزارهای مشابهی برای کمک به آنها نیاز دارند.