پس از Snowflake، Databricks همچنین با Tecton ادغام می شود تا پروژه های ML سازمانی را تسریع بخشد.


برای تقویت بیشتر تعهد خود به ارائه پوشش پیشرو در صنعت فناوری داده، VentureBeat مشتاق استقبال از اندرو براست و تونی بائر به عنوان مشارکت کنندگان عادی است. مراقب مقالات آنها در Data Pipeline باشید.

Databricks از فروشگاه ویژگی های Tecton پشتیبانی می کند، زیرا تعداد فزاینده ای از شرکت ها به دنبال استفاده از پلت فرم lakehouse آن برای پروژه های یادگیری ماشین (ML) هستند.

در بیانیه‌ای در روز پنج‌شنبه، تکتون یکپارچه‌سازی را اعلام کرد که فروشگاه ویژگی‌های خود را در پلتفرم Databricks در دسترس قرار می‌دهد و به مشتریان مشترک راهی برای ساخت و خودکارسازی خطوط لوله ویژگی ML، از نمونه اولیه تا تولید، در عرض چند دقیقه می‌دهد.

تکتون با تکیه بر پایه قدرتمند و مقیاس پذیر Databricks برای داده ها و هوش مصنوعی، زیرساخت داده زیربنایی را برای پشتیبانی از الزامات خاص ML گسترش می دهد. مایک دل بالسو، یکی از بنیانگذاران و مدیرعامل تکتون، گفت: این همکاری با Databricks به سازمان‌ها امکان می‌دهد تا یادگیری ماشینی را در برنامه‌های کاربردی و فرآیندهای تجاری زنده، با مشتری و فرآیندهای تجاری، سریع، قابل اعتماد و در مقیاس جاسازی کنند.

چگونه فروشگاه ویژگی های Tecton استقرار برنامه ML را تسریع می کند؟

برای کارکرد هر برنامه پیش‌بینی‌کننده، مدل ML زیر باید بر روی داده‌های تاریخی آموزش داده شود. در بیشتر موارد، این داده‌ها را می‌توان به‌عنوان یک جدول، با ردیف‌هایی که عناصر خاصی را نشان می‌دهند و ستون‌هایی که ویژگی‌هایی را برای توصیف آن عناصر ارائه می‌دهند، تجسم کرد. هر صفت منفرد یا ویژگی قابل اندازه گیری، یک ویژگی نامیده می شود. دانشمندان داده معمولاً برای ایجاد ویژگی‌هایی برای مدل‌های ML، تبدیل‌هایی را روی داده‌های خام اعمال می‌کنند، اما این فرآیند با چالش‌های مهندسی منحصربه‌فرد همراه است و زمان زیادی را می‌طلبد و بر جدول زمانی آموزش و استقرار تأثیر می‌گذارد.

یک فروشگاه ویژگی مکانی اختصاصی را در اختیار دانشمندان داده قرار می‌دهد تا ویژگی‌های توسعه‌یافته را برای استفاده مجدد در مراحل بعدی یا توسط یکی دیگر از اعضای تیم در همان سازمان ذخیره کنند. Tecton نیز همین کار را انجام می دهد، اگرچه ارائه آن یک گام جلوتر است و همچنین کل چرخه عمر ویژگی های ML را خودکار می کند – از تبدیل داده های خام تا ارائه برای استنتاج.

به این ترتیب، هنگامی که با Databricks یکپارچه می شود، تیم ها می توانند ساخت ویژگی های ML را خودکار کرده و برنامه های کاربردی ML را به جای چند ماه در چند دقیقه عملیاتی کنند. همه چیز بدون نیاز به ترک فضای کاری Databricks کار می کند.

یک کاربر Databricks می‌تواند ویژگی‌ها را در Tecton تعریف کند و آن ویژگی‌ها با استفاده از Databricks پردازش، هماهنگ و ذخیره می‌شوند. دل بالسو به VentureBeat گفت: آن‌ها در دفترچه Databricks برای کاربرانی که مدل‌های آموزشی هستند و همچنین برای استنتاج آنلاین در دسترس هستند، در دسترس خواهند بود.

«ویژگی‌های تاریخی در دریاچه دلتا ذخیره می‌شوند، به این معنی که همه ویژگی‌هایی که کاربر می‌سازد به‌طور بومی در خانه داده در دسترس هستند. کاربران Databricks همچنین به MLflow دسترسی دارند، جایی که می‌توانند مدل‌های آموزش‌دیده را میزبانی کنند و برای ارائه پیش‌بینی‌های زمان واقعی، نقاط پایانی سرویس ایجاد کنند. به طور خلاصه، از طریق این یکپارچه‌سازی، کاربر Databricks می‌تواند ویژگی‌ها را در Tecton تعریف و مدیریت کند، مقادیر ویژگی‌ها را با استفاده از Databricks محاسبه کند و پیش‌بینی‌ها را با استفاده از MLflow ارائه کند.

پذیرش گسترده

چندین مشتری Tecton و Databricks، از جمله شرکت های Fortune 500، در حال حاضر از این ادغام برای تقویت برنامه های پیش بینی بلادرنگ مانند تشخیص تقلب، پذیره نویسی بلادرنگ، قیمت گذاری پویا، توصیه ها و شخصی سازی استفاده می کنند. با این حال، Databricks تنها شرکتی نیست که این نوع ادغام را دارد.

چند ماه پیش، Snowflake نیز با Tecton همکاری کرد تا فروشگاه ویژگی های خود را در ابر داده خود معرفی کند. این تعامل همچنین شامل ادغام فروشگاه ویژگی منبع باز آن “Feast” بود.

ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معاملات انجام دهند. کسب اطلاعات بیشتر در مورد عضویت.