برای تقویت بیشتر تعهد خود به ارائه پوشش پیشرو در صنعت فناوری داده، VentureBeat مشتاق استقبال از اندرو براست و تونی بائر به عنوان مشارکت کنندگان عادی است. مراقب مقالات آنها در Data Pipeline باشید.
Databricks از فروشگاه ویژگی های Tecton پشتیبانی می کند، زیرا تعداد فزاینده ای از شرکت ها به دنبال استفاده از پلت فرم lakehouse آن برای پروژه های یادگیری ماشین (ML) هستند.
در بیانیهای در روز پنجشنبه، تکتون یکپارچهسازی را اعلام کرد که فروشگاه ویژگیهای خود را در پلتفرم Databricks در دسترس قرار میدهد و به مشتریان مشترک راهی برای ساخت و خودکارسازی خطوط لوله ویژگی ML، از نمونه اولیه تا تولید، در عرض چند دقیقه میدهد.
تکتون با تکیه بر پایه قدرتمند و مقیاس پذیر Databricks برای داده ها و هوش مصنوعی، زیرساخت داده زیربنایی را برای پشتیبانی از الزامات خاص ML گسترش می دهد. مایک دل بالسو، یکی از بنیانگذاران و مدیرعامل تکتون، گفت: این همکاری با Databricks به سازمانها امکان میدهد تا یادگیری ماشینی را در برنامههای کاربردی و فرآیندهای تجاری زنده، با مشتری و فرآیندهای تجاری، سریع، قابل اعتماد و در مقیاس جاسازی کنند.
چگونه فروشگاه ویژگی های Tecton استقرار برنامه ML را تسریع می کند؟
برای کارکرد هر برنامه پیشبینیکننده، مدل ML زیر باید بر روی دادههای تاریخی آموزش داده شود. در بیشتر موارد، این دادهها را میتوان بهعنوان یک جدول، با ردیفهایی که عناصر خاصی را نشان میدهند و ستونهایی که ویژگیهایی را برای توصیف آن عناصر ارائه میدهند، تجسم کرد. هر صفت منفرد یا ویژگی قابل اندازه گیری، یک ویژگی نامیده می شود. دانشمندان داده معمولاً برای ایجاد ویژگیهایی برای مدلهای ML، تبدیلهایی را روی دادههای خام اعمال میکنند، اما این فرآیند با چالشهای مهندسی منحصربهفرد همراه است و زمان زیادی را میطلبد و بر جدول زمانی آموزش و استقرار تأثیر میگذارد.
یک فروشگاه ویژگی مکانی اختصاصی را در اختیار دانشمندان داده قرار میدهد تا ویژگیهای توسعهیافته را برای استفاده مجدد در مراحل بعدی یا توسط یکی دیگر از اعضای تیم در همان سازمان ذخیره کنند. Tecton نیز همین کار را انجام می دهد، اگرچه ارائه آن یک گام جلوتر است و همچنین کل چرخه عمر ویژگی های ML را خودکار می کند – از تبدیل داده های خام تا ارائه برای استنتاج.
به این ترتیب، هنگامی که با Databricks یکپارچه می شود، تیم ها می توانند ساخت ویژگی های ML را خودکار کرده و برنامه های کاربردی ML را به جای چند ماه در چند دقیقه عملیاتی کنند. همه چیز بدون نیاز به ترک فضای کاری Databricks کار می کند.
یک کاربر Databricks میتواند ویژگیها را در Tecton تعریف کند و آن ویژگیها با استفاده از Databricks پردازش، هماهنگ و ذخیره میشوند. دل بالسو به VentureBeat گفت: آنها در دفترچه Databricks برای کاربرانی که مدلهای آموزشی هستند و همچنین برای استنتاج آنلاین در دسترس هستند، در دسترس خواهند بود.
«ویژگیهای تاریخی در دریاچه دلتا ذخیره میشوند، به این معنی که همه ویژگیهایی که کاربر میسازد بهطور بومی در خانه داده در دسترس هستند. کاربران Databricks همچنین به MLflow دسترسی دارند، جایی که میتوانند مدلهای آموزشدیده را میزبانی کنند و برای ارائه پیشبینیهای زمان واقعی، نقاط پایانی سرویس ایجاد کنند. به طور خلاصه، از طریق این یکپارچهسازی، کاربر Databricks میتواند ویژگیها را در Tecton تعریف و مدیریت کند، مقادیر ویژگیها را با استفاده از Databricks محاسبه کند و پیشبینیها را با استفاده از MLflow ارائه کند.
پذیرش گسترده
چندین مشتری Tecton و Databricks، از جمله شرکت های Fortune 500، در حال حاضر از این ادغام برای تقویت برنامه های پیش بینی بلادرنگ مانند تشخیص تقلب، پذیره نویسی بلادرنگ، قیمت گذاری پویا، توصیه ها و شخصی سازی استفاده می کنند. با این حال، Databricks تنها شرکتی نیست که این نوع ادغام را دارد.
چند ماه پیش، Snowflake نیز با Tecton همکاری کرد تا فروشگاه ویژگی های خود را در ابر داده خود معرفی کند. این تعامل همچنین شامل ادغام فروشگاه ویژگی منبع باز آن “Feast” بود.
ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معاملات انجام دهند. کسب اطلاعات بیشتر در مورد عضویت.