مدل یادگیری ماشینی نمایشی ریاضی از مجموعه قوانینی است که از داده ها آموخته می شوند. این خروجی فرآیند آموزش الگوریتم یادگیری ماشین است. سپس از این مدل برای پیش بینی یا تصمیم گیری بر اساس داده های جدید و نادیده استفاده می شود.
انواع مختلفی از مدل های یادگیری ماشینی وجود دارد.
شما می خواهید با انواع مختلف یادگیری ماشینی، از جمله درخت تصمیم، جنگل های تصادفی، ماشین های بردار پشتیبان و شبکه های عصبی آشنا شوید. هر مدلی نقاط قوت و ضعف خاص خود را دارد و برای انواع مختلف کارها مناسب است.
برای ایجاد یک مدل یادگیری ماشینی، باید الگوریتم را با مجموعه ای از داده های آموزشی ارائه دهید. سپس الگوریتم از این داده ها به همراه مجموعه ای از قوانین به نام الگوریتم یادگیری برای یادگیری در مورد روابط و الگوهای موجود در داده ها استفاده می کند. مدل به دست آمده مجموعه ای از معادلات ریاضی است که این الگوها را نشان می دهد و می تواند برای پیش بینی یا تصمیم گیری بر اساس داده های جدید و نادیده استفاده شود.
مدل دریفت چیست؟
رانش مدل زمانی است که عملکرد یک مدل یادگیری ماشین در طول زمان به دلیل تغییرات دنیای واقعی در داده هایی که به عنوان ورودی می گیرد کاهش می یابد. دو نوع اصلی دریفت مدل وجود دارد:
- رانش مفهومی زمانی اتفاق می افتد که روابط یا الگوهای موجود در داده ها در طول زمان تغییر می کنند. به عنوان مثال، یک مدل یادگیری ماشینی را در نظر بگیرید که برای پیش بینی کلاهبرداری کارت اعتباری آموزش دیده است. این مدل ممکن است بر روی یک مجموعه داده آموزش داده شود که شامل نسبت معینی از تراکنش های جعلی و غیر متقلبانه است. اگر نسبت تراکنش های تقلبی در طول زمان تغییر کند، عملکرد مدل ممکن است کاهش یابد زیرا دیگر قادر به پیش بینی دقیق نتیجه بر اساس توزیع داده های جدید نیست.
- رانش داده ها زمانی اتفاق می افتد که خود داده ها در طول زمان تغییر می کنند. به عنوان مثال، یک مدل یادگیری ماشینی را در نظر بگیرید که برای طبقه بندی تصاویر حیوانات آموزش دیده است. اگر این مدل بر روی مجموعه داده ای که شامل تصاویر سگ، گربه و پرندگان است آموزش داده شود، ممکن است در تصاویر جدید این حیوانات عملکرد خوبی داشته باشد. با این حال، اگر مدل با نوع جدیدی از حیوان که قبلاً ندیده است، مانند دلفین ارائه شود، ممکن است عملکرد ضعیفی داشته باشد زیرا دادههایی که روی آن آموزش داده شده شامل هیچ نمونهای از دلفین نیست.
یکی از راههای کاهش تأثیر رانش، آموزش منظم مدل بر روی دادههای جدید است تا اطمینان حاصل شود که دقیق و بهروز باقی میماند. در مورد این مدل فنی ML، دریفت (aporia dotcom؛ مفهوم رانش) بیشتر بدانید.
سیستمهای هوش مصنوعی تولید اثر رانش مدل چگونه عمل میکند؟
جابجایی مدل میتواند تأثیر قابلتوجهی بر سیستمهای هوش مصنوعی تولید داشته باشد، زیرا میتواند باعث پیشبینی یا طبقهبندی نادرست آنها شود. این می تواند منجر به عملکرد ضعیف و تصمیمات بالقوه مضر شود. در برخی موارد، ممکن است منجر به اختلال در عملکرد سیستم، ایجاد خسارات مالی یا حتی آسیب فیزیکی شود.
در سیستمهای هوش مصنوعی تولید، تغییر مدل میتواند به دلیل تغییر در توزیع دادههای ورودی در طول زمان، مانند تغییر در رفتار مشتری یا شرایط بازار رخ دهد. همچنین ممکن است به دلیل تغییراتی در خود سیستم مانند به روز رسانی سخت افزار یا نرم افزار رخ دهد.
برای کاهش تاثیر جابجایی مدل، نظارت منظم بر عملکرد سیستمهای هوش مصنوعی و آموزش مجدد مدلها در صورت نیاز بسیار مهم است. از تکنیک هایی مانند یادگیری فعال و یادگیری آنلاین نیز می توان برای تطبیق مدل ها با تغییرات داده های ورودی به طور مداوم استفاده کرد. علاوه بر این، استفاده از روشهای مجموعهای که چندین مدل را با هم ترکیب میکنند میتواند مفید باشد، زیرا این میتواند به کاهش تأثیر رانش مدل کمک کند.
همچنین مهم است که درک خوبی از داده های اساسی و سیستم داشته باشید تا هرگونه نشانه ای از رانش را تشخیص دهید و اقدامات لازم را انجام دهید، مانند آموزش مجدد مدل، تنظیم دقیق پارامترها یا جمع آوری داده های بیشتر.
آیا با توجه به مشکل دریفت مدل می توانیم به هوش مصنوعی اعتماد کنیم؟
هنگام استفاده از سیستمهای هوش مصنوعی (AI) آگاه بودن از پتانسیل تغییر مدل مهم است، زیرا میتواند بر دقت و قابلیت اطمینان پیشبینیها یا تصمیمهای اتخاذ شده توسط مدل تأثیر بگذارد. با این حال، این لزوما به این معنی نیست که نمی توان به سیستم های هوش مصنوعی اعتماد کرد.
نکته کلیدی پذیرش و مدیریت ریسک ذاتی مدل های یادگیری ماشینی است. این به عنوان “ریسک مدل” شناخته می شود – این خطر که یک مدل یادگیری ماشین ممکن است پیش بینی ها یا تصمیمات نادرستی بگیرد که می تواند عواقب منفی برای صاحبان یا کاربران آن داشته باشد.
به عنوان مثال، مورد Zillow، یک بازار املاک و مستغلات و اجاره را در نظر بگیرید. در سال 2021، بیش از 500 میلیون دلار زیان به دلیل الگوریتم ارزیابی دارایی که ارزش املاک و مستغلات را بیش از حد تخمین میزند، متحمل زیان شد و شرکت را به سرمایهگذاری بیش از حد در هنگام خرید خانه سوق داد. در نتیجه، شرکت مجبور به کاهش نیروی کار خود شده است.
Zillow احتمالاً قبل از ارائه مدل یادگیری ماشینی، آزمایش های دقیقی را انجام داده است. عرضه در تولید تدریجی بود و به شرکت اجازه داد تا عملکرد خود را در دنیای واقعی ارزیابی کند. با این حال، شرکت پس از آن برنامه خرید خود را در مدت کوتاهی گسترش داد در حالی که شرایط بازار شروع به تغییر کرد (انحراف مفهوم). بنابراین، این مدل دیگر منعکس کننده بازار املاک و مستغلات نیست.
این نشان میدهد که چرا برای شرکتها مهم است که در مدیریت ریسک مدل فعال باشند تا اطمینان حاصل کنند که سیستمهای یادگیری ماشین آنها پیشبینیها یا تصمیمگیریهای دقیقی انجام میدهند. اگر زیلو مدل را با دقت بیشتری زیر نظر داشت، میتوانست از تاثیر رانش مدل جلوگیری شود.
آنچه که توسعه دهندگان هوش مصنوعی می توانند در مورد Drift انجام دهند
چندین کار وجود دارد که توسعهدهندگان هوش مصنوعی میتوانند برای کاهش تأثیر تغییر مدل انجام دهند:
- به طور منظم مدل را بر روی داده های جدید بازآموزی کنید: یکی از راه های اطمینان از اینکه مدل دقیق و به روز باقی می ماند این است که به طور منظم آن را بر روی داده های جدید بازآموزی کنید. این می تواند به کاهش تأثیر رانش مفهوم و رانش داده کمک کند.
- از تکنیک هایی مانند یادگیری آنلاین استفاده کنید: یادگیری آنلاین یک رویکرد یادگیری ماشینی است که به مدل اجازه می دهد تا با در دسترس قرار گرفتن داده های جدید، خود را به طور مداوم به روز کند. این می تواند به کاهش تأثیر رانش مفهوم و رانش داده کمک کند.
- نظارت بر عملکرد مدل: هنگامی که مدل در یک محیط تولید مستقر شد، نظارت مداوم بر عملکرد آن برای اطمینان از اینکه هنوز در حال انجام پیشبینیها یا تصمیمگیریهای دقیق است، مهم است. این می تواند به شناسایی هرگونه تغییر در توزیع داده یا سایر عواملی که ممکن است باعث تغییر مدل شود کمک کند. نظارت باید یک فرآیند مداوم باشد.
- استفاده از مدل های متعدد: استفاده از چندین مدل می تواند به کاهش ریسک تکیه بر یک مدل که ممکن است در معرض تغییر مدل باشد، کمک کند. با ترکیب پیش بینی ها یا تصمیم گیری های چند مدل، می توان عملکرد کلی سیستم را بهبود بخشید.
- نظارت انسانی را اضافه کنید: در برخی موارد، ممکن است استفاده از نظارت انسانی برای بررسی یا اعتبارسنجی پیشبینیها یا تصمیمهای اتخاذ شده توسط مدل مناسب باشد. این می تواند به اطمینان حاصل شود که از سیستم به درستی استفاده می شود و هر گونه مشکل احتمالی برطرف می شود.
نتیجه
در نتیجه، رانش مدل پدیده ای است که می تواند عملکرد سیستم های هوش مصنوعی (AI) را در طول زمان به طور قابل توجهی تحت تاثیر قرار دهد. زمانی اتفاق میافتد که توزیع دادهها یا روابط موجود در دادههایی که مدل در مورد آن آموزش داده شده است، تغییر میکند و منجر به کاهش دقت و قابلیت اطمینان مدل میشود.
مدیریت هر دو مفهوم و جابجایی داده ها می تواند چالش برانگیز باشد زیرا پیش بینی و شناسایی آنها دشوار است. با این حال، توسعه دهندگان هوش مصنوعی با انجام اقداماتی مانند بازآموزی منظم مدل بر روی دادههای جدید، استفاده از تکنیکهای یادگیری آنلاین و استفاده از مدلهای متعدد، میتوانند تأثیر تغییر مدل را کاهش دهند و قابلیت اطمینان سیستمهای خود را بهبود بخشند.
اعتبار تصویر ویژه: ارائه شده توسط نویسنده. Vecteezy; متشکرم!