دریفت مدل: پاشنه آشیل هوش مصنوعی توضیح داده شد


مدل یادگیری ماشینی نمایشی ریاضی از مجموعه قوانینی است که از داده ها آموخته می شوند. این خروجی فرآیند آموزش الگوریتم یادگیری ماشین است. سپس از این مدل برای پیش بینی یا تصمیم گیری بر اساس داده های جدید و نادیده استفاده می شود.

انواع مختلفی از مدل های یادگیری ماشینی وجود دارد.

شما می خواهید با انواع مختلف یادگیری ماشینی، از جمله درخت تصمیم، جنگل های تصادفی، ماشین های بردار پشتیبان و شبکه های عصبی آشنا شوید. هر مدلی نقاط قوت و ضعف خاص خود را دارد و برای انواع مختلف کارها مناسب است.

برای ایجاد یک مدل یادگیری ماشینی، باید الگوریتم را با مجموعه ای از داده های آموزشی ارائه دهید. سپس الگوریتم از این داده ها به همراه مجموعه ای از قوانین به نام الگوریتم یادگیری برای یادگیری در مورد روابط و الگوهای موجود در داده ها استفاده می کند. مدل به دست آمده مجموعه ای از معادلات ریاضی است که این الگوها را نشان می دهد و می تواند برای پیش بینی یا تصمیم گیری بر اساس داده های جدید و نادیده استفاده شود.

مدل دریفت چیست؟

رانش مدل زمانی است که عملکرد یک مدل یادگیری ماشین در طول زمان به دلیل تغییرات دنیای واقعی در داده هایی که به عنوان ورودی می گیرد کاهش می یابد. دو نوع اصلی دریفت مدل وجود دارد:

  • رانش مفهومی زمانی اتفاق می افتد که روابط یا الگوهای موجود در داده ها در طول زمان تغییر می کنند. به عنوان مثال، یک مدل یادگیری ماشینی را در نظر بگیرید که برای پیش بینی کلاهبرداری کارت اعتباری آموزش دیده است. این مدل ممکن است بر روی یک مجموعه داده آموزش داده شود که شامل نسبت معینی از تراکنش های جعلی و غیر متقلبانه است. اگر نسبت تراکنش های تقلبی در طول زمان تغییر کند، عملکرد مدل ممکن است کاهش یابد زیرا دیگر قادر به پیش بینی دقیق نتیجه بر اساس توزیع داده های جدید نیست.
  • رانش داده ها زمانی اتفاق می افتد که خود داده ها در طول زمان تغییر می کنند. به عنوان مثال، یک مدل یادگیری ماشینی را در نظر بگیرید که برای طبقه بندی تصاویر حیوانات آموزش دیده است. اگر این مدل بر روی مجموعه داده ای که شامل تصاویر سگ، گربه و پرندگان است آموزش داده شود، ممکن است در تصاویر جدید این حیوانات عملکرد خوبی داشته باشد. با این حال، اگر مدل با نوع جدیدی از حیوان که قبلاً ندیده است، مانند دلفین ارائه شود، ممکن است عملکرد ضعیفی داشته باشد زیرا داده‌هایی که روی آن آموزش داده شده شامل هیچ نمونه‌ای از دلفین نیست.

یکی از راه‌های کاهش تأثیر رانش، آموزش منظم مدل بر روی داده‌های جدید است تا اطمینان حاصل شود که دقیق و به‌روز باقی می‌ماند. در مورد این مدل فنی ML، دریفت (aporia dotcom؛ مفهوم رانش) بیشتر بدانید.

سیستم‌های هوش مصنوعی تولید اثر رانش مدل چگونه عمل می‌کند؟

جابجایی مدل می‌تواند تأثیر قابل‌توجهی بر سیستم‌های هوش مصنوعی تولید داشته باشد، زیرا می‌تواند باعث پیش‌بینی یا طبقه‌بندی نادرست آن‌ها شود. این می تواند منجر به عملکرد ضعیف و تصمیمات بالقوه مضر شود. در برخی موارد، ممکن است منجر به اختلال در عملکرد سیستم، ایجاد خسارات مالی یا حتی آسیب فیزیکی شود.

در سیستم‌های هوش مصنوعی تولید، تغییر مدل می‌تواند به دلیل تغییر در توزیع داده‌های ورودی در طول زمان، مانند تغییر در رفتار مشتری یا شرایط بازار رخ دهد. همچنین ممکن است به دلیل تغییراتی در خود سیستم مانند به روز رسانی سخت افزار یا نرم افزار رخ دهد.

برای کاهش تاثیر جابجایی مدل، نظارت منظم بر عملکرد سیستم‌های هوش مصنوعی و آموزش مجدد مدل‌ها در صورت نیاز بسیار مهم است. از تکنیک هایی مانند یادگیری فعال و یادگیری آنلاین نیز می توان برای تطبیق مدل ها با تغییرات داده های ورودی به طور مداوم استفاده کرد. علاوه بر این، استفاده از روش‌های مجموعه‌ای که چندین مدل را با هم ترکیب می‌کنند می‌تواند مفید باشد، زیرا این می‌تواند به کاهش تأثیر رانش مدل کمک کند.

همچنین مهم است که درک خوبی از داده های اساسی و سیستم داشته باشید تا هرگونه نشانه ای از رانش را تشخیص دهید و اقدامات لازم را انجام دهید، مانند آموزش مجدد مدل، تنظیم دقیق پارامترها یا جمع آوری داده های بیشتر.

آیا با توجه به مشکل دریفت مدل می توانیم به هوش مصنوعی اعتماد کنیم؟

هنگام استفاده از سیستم‌های هوش مصنوعی (AI) آگاه بودن از پتانسیل تغییر مدل مهم است، زیرا می‌تواند بر دقت و قابلیت اطمینان پیش‌بینی‌ها یا تصمیم‌های اتخاذ شده توسط مدل تأثیر بگذارد. با این حال، این لزوما به این معنی نیست که نمی توان به سیستم های هوش مصنوعی اعتماد کرد.

نکته کلیدی پذیرش و مدیریت ریسک ذاتی مدل های یادگیری ماشینی است. این به عنوان “ریسک مدل” شناخته می شود – این خطر که یک مدل یادگیری ماشین ممکن است پیش بینی ها یا تصمیمات نادرستی بگیرد که می تواند عواقب منفی برای صاحبان یا کاربران آن داشته باشد.

به عنوان مثال، مورد Zillow، یک بازار املاک و مستغلات و اجاره را در نظر بگیرید. در سال 2021، بیش از 500 میلیون دلار زیان به دلیل الگوریتم ارزیابی دارایی که ارزش املاک و مستغلات را بیش از حد تخمین می‌زند، متحمل زیان شد و شرکت را به سرمایه‌گذاری بیش از حد در هنگام خرید خانه سوق داد. در نتیجه، شرکت مجبور به کاهش نیروی کار خود شده است.

Zillow احتمالاً قبل از ارائه مدل یادگیری ماشینی، آزمایش های دقیقی را انجام داده است. عرضه در تولید تدریجی بود و به شرکت اجازه داد تا عملکرد خود را در دنیای واقعی ارزیابی کند. با این حال، شرکت پس از آن برنامه خرید خود را در مدت کوتاهی گسترش داد در حالی که شرایط بازار شروع به تغییر کرد (انحراف مفهوم). بنابراین، این مدل دیگر منعکس کننده بازار املاک و مستغلات نیست.

این نشان می‌دهد که چرا برای شرکت‌ها مهم است که در مدیریت ریسک مدل فعال باشند تا اطمینان حاصل کنند که سیستم‌های یادگیری ماشین آنها پیش‌بینی‌ها یا تصمیم‌گیری‌های دقیقی انجام می‌دهند. اگر زیلو مدل را با دقت بیشتری زیر نظر داشت، می‌توانست از تاثیر رانش مدل جلوگیری شود.

آنچه که توسعه دهندگان هوش مصنوعی می توانند در مورد Drift انجام دهند

چندین کار وجود دارد که توسعه‌دهندگان هوش مصنوعی می‌توانند برای کاهش تأثیر تغییر مدل انجام دهند:

  • به طور منظم مدل را بر روی داده های جدید بازآموزی کنید: یکی از راه های اطمینان از اینکه مدل دقیق و به روز باقی می ماند این است که به طور منظم آن را بر روی داده های جدید بازآموزی کنید. این می تواند به کاهش تأثیر رانش مفهوم و رانش داده کمک کند.
  • از تکنیک هایی مانند یادگیری آنلاین استفاده کنید: یادگیری آنلاین یک رویکرد یادگیری ماشینی است که به مدل اجازه می دهد تا با در دسترس قرار گرفتن داده های جدید، خود را به طور مداوم به روز کند. این می تواند به کاهش تأثیر رانش مفهوم و رانش داده کمک کند.
  • نظارت بر عملکرد مدل: هنگامی که مدل در یک محیط تولید مستقر شد، نظارت مداوم بر عملکرد آن برای اطمینان از اینکه هنوز در حال انجام پیش‌بینی‌ها یا تصمیم‌گیری‌های دقیق است، مهم است. این می تواند به شناسایی هرگونه تغییر در توزیع داده یا سایر عواملی که ممکن است باعث تغییر مدل شود کمک کند. نظارت باید یک فرآیند مداوم باشد.
  • استفاده از مدل های متعدد: استفاده از چندین مدل می تواند به کاهش ریسک تکیه بر یک مدل که ممکن است در معرض تغییر مدل باشد، کمک کند. با ترکیب پیش بینی ها یا تصمیم گیری های چند مدل، می توان عملکرد کلی سیستم را بهبود بخشید.
  • نظارت انسانی را اضافه کنید: در برخی موارد، ممکن است استفاده از نظارت انسانی برای بررسی یا اعتبارسنجی پیش‌بینی‌ها یا تصمیم‌های اتخاذ شده توسط مدل مناسب باشد. این می تواند به اطمینان حاصل شود که از سیستم به درستی استفاده می شود و هر گونه مشکل احتمالی برطرف می شود.

نتیجه

در نتیجه، رانش مدل پدیده ای است که می تواند عملکرد سیستم های هوش مصنوعی (AI) را در طول زمان به طور قابل توجهی تحت تاثیر قرار دهد. زمانی اتفاق می‌افتد که توزیع داده‌ها یا روابط موجود در داده‌هایی که مدل در مورد آن آموزش داده شده است، تغییر می‌کند و منجر به کاهش دقت و قابلیت اطمینان مدل می‌شود.

مدیریت هر دو مفهوم و جابجایی داده ها می تواند چالش برانگیز باشد زیرا پیش بینی و شناسایی آنها دشوار است. با این حال، توسعه دهندگان هوش مصنوعی با انجام اقداماتی مانند بازآموزی منظم مدل بر روی داده‌های جدید، استفاده از تکنیک‌های یادگیری آنلاین و استفاده از مدل‌های متعدد، می‌توانند تأثیر تغییر مدل را کاهش دهند و قابلیت اطمینان سیستم‌های خود را بهبود بخشند.

اعتبار تصویر ویژه: ارائه شده توسط نویسنده. Vecteezy; متشکرم!

گیلاد مایان

نویسنده فناوری

من یک نویسنده فناوری با 20 سال تجربه کار با برندهای تکنولوژی پیشرو از جمله SAP، Imperva، CheckPoint و NetApp هستم. من سه بار برنده جایزه بین المللی ارتباطات فنی هستم. امروز من Agile SEO، آژانس بازاریابی و محتوا پیشرو در صنعت فناوری را رهبری می کنم.