مک کینزی ابزار خط لوله یادگیری ماشین Kedro را به بنیاد لینوکس اهدا می کند


آیا جلسه ای از نشست Future of Work را از دست داده اید؟ برای پخش جریانی به کتابخانه بر اساس تقاضای Future of Work Summit بروید.


اجازه دهید خبرنامه OSS Enterprise سفر منبع باز خود را راهنمایی کنید! ثبت نام.

بنیاد لینوکس، کنسرسیوم غیرانتفاعی که یک مرکز بی طرف از فروشنده برای پروژه های منبع باز فراهم می کند. امروز اعلام کرد که QuantumBlack مک کینزی Kedro، یک ابزار خط لوله یادگیری ماشین را به جامعه منبع باز اهدا خواهد کرد. بنیاد لینوکس Kedro را زیر نظر AI & Data (LF AI & Data) بنیاد لینوکس (LF AI & Data) حفظ خواهد کرد، یک سازمان چتری که در سال 2018 برای تقویت نوآوری در هوش مصنوعی با حمایت از پروژه‌های فنی، جوامع توسعه‌دهنده و شرکت‌ها تأسیس شد.

ما از استقبال از پروژه Kedro در LF AI & Data هیجان‌زده هستیم. ابراهیم حداد، مدیر اجرایی LF AI & Data، گفت: این به چالش‌های بسیاری که در ایجاد محصولات یادگیری ماشینی امروزی وجود دارد می‌پردازد و مکمل فوق‌العاده‌ای برای مجموعه پروژه‌های فنی میزبانی ما است. “ما مشتاقانه منتظر همکاری با جامعه برای رشد ردپای پروژه و ایجاد فرصت های همکاری جدید با اعضای خود، پروژه های میزبانی شده و جامعه منبع باز بزرگتر هستیم.”

اهمیت خطوط لوله

خط لوله یادگیری ماشین ساختاری است که جریان داده ها را به مدل یادگیری ماشینی و خارج از آن هماهنگ می کند. خطوط لوله شامل داده‌های خام، پردازش داده‌ها، پیش‌بینی‌ها و متغیرهایی است که رفتار مدل را با هدف کدگذاری گردش کار به‌گونه‌ای تنظیم می‌کنند که بتوان آن را در یک سازمان به اشتراک گذاشت.

بسیاری از ابزارهای ایجاد خط لوله یادگیری ماشینی وجود دارد، اما Kedro در صحنه نسبتاً جدید است. این چارچوب در سال 2019 توسط McKinsey راه‌اندازی شد، این چارچوبی است که به زبان پایتون نوشته شده است که مفاهیم را از مهندسی نرم‌افزار وام گرفته و آن‌ها را به دنیای علم داده می‌آورد، و زمینه را برای تبدیل پروژه از یک ایده به یک محصول نهایی فراهم می‌کند.

به گفته Yetunde Dada، ​​رهبر محصول در Kedro، Kedro برای رفع کاستی های اصلی اسکریپت های یکباره و “کد چسب” با تمرکز بر ایجاد کد علم داده قابل نگهداری و کارآمد توسعه یافته است. با ایجاد مدولاریت، یکی از اهداف الهام بخشیدن به ایجاد کدهای تجزیه و تحلیل قابل استفاده مجدد و افزایش همکاری تیمی بود.

طی دو سال و نیمی که Kedro در GitHub در دسترس بوده است، جامعه و پایگاه کاربران به بیش از 200000 بارگیری ماهانه و بیش از 100 مشارکت کننده افزایش یافته است. Telkomsel، بزرگترین ارائه دهنده شبکه بی سیم اندونزی، از Kedro به عنوان یک استاندارد در سراسر سازمان علم داده خود استفاده می کند.

“این تنها راه است [Kedro] دادا در بیانیه ای گفت: می تواند در این مرحله رشد کند – اگر توسط بهترین افراد در سراسر جهان بهبود یابد. «تیم بین رشته‌ای ما متشکل از 15 نفر با این نقطه عطف به توسعه و اعتبار بیشتر Kedro دست پیدا می‌کند. همچنین علامت قابل توجهی از اعتبار برای Kedro به عنوان یک ابزار صنعتی واقعی است که به مجموعه ای از پروژه های منبع باز پیشرفته دیگر مانند Kubernetes اهدا شده توسط Google، GraphQL توسط Facebook یا MLFlow و Delta Lake توسط Databricks می پیوندد.

استفاده در آینده

نرم‌افزار متن‌باز در سازمانی فراگیر شده است، جایی که در حال حاضر حتی در تنظیمات حیاتی از آن استفاده می‌شود. طبق یک نظرسنجی در سال 2021، درحالی‌که یکپارچگی نرم‌افزار مورد سوال است – به‌ویژه با توجه به رویدادهای اخیر – هفتاد و نه درصد از شرکت‌ها انتظار دارند که استفاده از نرم‌افزار منبع باز برای فناوری‌های نوظهور طی دو سال آینده افزایش یابد.

به گفته شوارتزمن، پس از منبع باز، Kedro همچنان پایه و اساس پروژه های تحلیلی در مک کینزی خواهد بود. جوئل شوارتزمن، مدیر محصول، در یک پست وبلاگ گفت: «ایده‌ها و نرده‌های محافظی که در Kedro وجود دارد بازتابی از آن تجربه است و برای کمک به توسعه‌دهندگان طراحی شده‌اند تا از دام‌های رایج اجتناب کنند و بهترین شیوه‌ها را دنبال کنند».

یکی از سخنگویان از طریق ایمیل اضافه کرد: «Kedro بر روی دنبال کردن یک API پایدار یا نسخه 1.0، ادغام رسمی با ابزارهای توسعه‌دهنده و پلتفرم‌های ابری و ادامه کار بر روی عملکرد ردیابی آزمایش ما متمرکز خواهد بود. ما از کاربران خود می خواهیم که به راحتی نسخه های Kedro را ارتقا دهند و از ویژگی های جدید بهره مند شوند. در حال حاضر، Kedro از ادغام های ابتدایی با ارائه دهندگان مختلف ابر پشتیبانی می کند و ما می خواهیم با ارائه دهندگان ابر برای ایجاد یکپارچگی یکپارچه کار کنیم. ردیابی آزمایش، راهی برای دانشمندان داده برای پیگیری آزمایش‌های علم داده، راه را برای کاربران برای یافتن و ارتقای مدل‌های تولید هموار کرده است. با توجه به مشکلات کاربر، این قابلیت را با بسیاری از ویژگی‌های بیشتر گسترش خواهیم داد.»

Kedro به یکی دیگر از ابزارهای منبع باز خط لوله که توسط مایکروسافت در ماه نوامبر منتشر شد می پیوندد: SynapseML. با SynapseML، مانند Kedro، توسعه‌دهندگان می‌توانند سیستم‌هایی برای حل چالش‌ها در دامنه‌های مختلف از جمله تجزیه و تحلیل متن، ترجمه و پردازش گفتار بسازند.

VentureBeat

ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری تحول آفرین به دست آورند و معاملات انجام دهند. سایت ما اطلاعات ضروری در مورد فن آوری ها و استراتژی های داده را ارائه می دهد تا شما را در حین رهبری سازمان خود راهنمایی کند. ما از شما دعوت می کنیم که عضو انجمن ما شوید، برای دسترسی به:

  • اطلاعات به روز در مورد موضوعات مورد علاقه شما
  • خبرنامه های ما
  • محتویات رهبر فکر و دسترسی با تخفیف به رویدادهای ارزشمند ما، مانند تبدیل 2021: بیشتر بدانید
  • ویژگی های شبکه و موارد دیگر

عضو شوید