با بهبود دقت مدل‌های بینایی کامپیوتری، Voxel51 12.5 میلیون دلار جمع‌آوری می‌کند


آیا نتوانستید در Transform 2022 شرکت کنید؟ اکنون تمام جلسات اجلاس را در کتابخانه درخواستی ما بررسی کنید! اینجا را تماشا کنید.


مدل‌های هوش مصنوعی بینایی کامپیوتری به داشتن داده‌های برچسب‌گذاری شده مناسب برای استنباط شی درست متکی هستند. چالش کمک به راستی‌آزمایی دقیق بودن داده‌های مورد استفاده برای یک مدل، چالشی است که Ann Arbor، استارت‌آپ Voxel51 مستقر در میشیگان، با ابزارهای منبع باز و یک سرویس تجاری به نام FiftyOne Teams قصد دارد آن را حل کند.

Ann Arbor خانه دانشگاه میشیگان است، جایی که یکی از بنیانگذاران و مدیر عامل Voxel51، Jason Corso به عنوان استاد کار می کند، و جایی که او ایده ساخت شرکت جدید را پیدا کرد. تحقیقات کورسو بر روی کاربردهای بینایی کامپیوتری مانند رابطه ویدیو با زبان طبیعی تمرکز دارد. در سال های اخیر، همانطور که پذیرش بینایی کامپیوتری رشد کرده است، اندازه مجموعه داده ها نیز افزایش یافته است.

کورسو به VentureBeat گفت: «زمانی که دانش‌آموز مقطع کارشناسی ارشد بودم، مجموعه داده‌هایی داشتم که به ده‌ها عدد می‌رسید و می‌توانستم به هر نمونه نگاه کنم. اکنون شاگردان من آمده اند و نمی توانند به یک میلیون نمونه نگاه کنند. این فقط امکان پذیر نیست، بنابراین نیاز به Voxel51 از آن ناشی شد.

این نیازی است که در بازار و سرمایه گذاران مورد استقبال قرار گرفته است. امروز، این شرکت اعلام کرد که 12.5 میلیون دلار سرمایه در سری A از Drive Capital، Top Harvest و Shasta Ventures، و همچنین از سرمایه گذاران موجود eLab Ventures و ID Ventures و دانشگاه میشیگان جذب کرده است.

رویداد

MetaBeat 2022

MetaBeat رهبران فکری را گرد هم می‌آورد تا راهنمایی کنند که چگونه فن‌آوری متاورس نحوه برقراری ارتباط و انجام تجارت همه صنایع را در 4 اکتبر در سانفرانسیسکو، کالیفرنیا تغییر خواهد داد.

اینجا ثبت نام کنید

چالش و فرصت داده های بدون ساختار برای بینایی کامپیوتر

داده‌های بدون ساختار اشکال مختلفی دارند و شامل هر نوع داده‌ای می‌شوند که در قالب ساختار داده خاص (مثلاً ستون‌ها و ردیف‌ها) قرار نمی‌گیرند.

در میان رایج‌ترین اشکال داده‌های بدون ساختار، محتوای ویدئویی است که با افزایش روزافزون تعداد دوربین‌ها در سطح جهانی، به طور تصاعدی در حال رشد است. دریافت ارزش از داده های ویدئویی بدون ساختار می تواند به روش های مختلفی اتفاق بیفتد. کورسو خاطرنشان کرد که فناوری‌هایی وجود دارند که به کاربران کمک می‌کنند اطلاعات معنایی معنی‌داری را از تصاویر استخراج کنند، مانند ابزارهای ساده‌ای که به کاربران اجازه می‌دهد به دنبال تصاویر گرفته‌شده در یک مکان خاص بگردند.

در حالی که هیچ کمبودی در داده های تصویر بدون ساختار و مجموعه داده های بزرگی که برای کمک به آموزش مدل های بینایی کامپیوتری استفاده می شود وجود ندارد، اطمینان از دقت یک چالش است.

کورسو می‌گوید: «تمام نکته ما این است که وقتی مجموعه داده‌ها به بیش از 10 میلیون نمونه رسید، دیگر کسی به خود زحمت نگاه کردن به تصاویر را نداد.

کاری که Voxel51 انجام می دهد این است که به عنوان پلی بین کاری که مهندس داده هنگام ایجاد مجموعه داده ها انجام می دهد و کاری که همان مهندس یا شریک آنها هنگام آموزش مدل ها انجام می دهند عمل می کند. فناوری Voxel51 از تجسم حاشیه نویسی روی داده های تصویر پشتیبانی می کند و می تواند برای شناسایی خطاهای احتمالی و همچنین امکان مقایسه عملکرد مدل های مختلف به کاربران استفاده شود.

کورسو توضیح داد که Voxel51 کاربران را قادر می سازد تا داده ها را به صورت معنایی برش دهند تا صحت یک مدل را درک کنند. به عنوان مثال، از طریق یک API Python، کاربر می تواند یک پرس و جو را در مجموعه داده بینایی کامپیوتری اجرا کند تا تمام تصاویری را که در آنها یک مدل بهتر از مدل دیگر است، برای تصاویری که یک کودک در خیابان در حال دویدن است، بیابد.

منبع باز و شرکت

Voxel51 به عنوان یک محصول منبع باز شروع به کار کرد، اما در کنار اعلام بودجه، این شرکت به طور رسمی پیشنهاد سازمانی FiftyOne Teams خود را راه اندازی کرد که پشتیبانی تجاری و قابلیت های اضافی را ارائه می دهد.

پروژه منبع باز Voxel51 برای اولین بار در آگوست سال 2020 راه اندازی شد و در دو سال گذشته رشد کرده است، با بیش از 150000 کاربر ماهانه. کورسو گفت: “پروژه منبع باز برای کاربری با داده های محلی ساخته شده است، جایی که همه داده ها در یک سیستم واحد هستند.”

در مقابل، پیشنهاد FiftyOne Teams که به صورت تجاری پشتیبانی می‌شود، از داده‌های ابری و همچنین کنترل دسترسی مبتنی بر نقش (RBAC) پشتیبانی می‌کند تا چندین کاربر را قادر به استفاده ایمن از یک پلتفرم کند. در حال حاضر این سرویس تجاری به عنوان یک سرویس ابری کاملاً مدیریت شده ارائه نمی شود، در عوض سازمان ها همچنان باید فناوری را در محل یا در نمونه های ابری خود اجرا کنند.

کورسو: «ما آینده‌ای را متصور هستیم که در آن، حداقل برای انواع خاصی از مشتریان، شاید استارت‌آپ‌هایی که نمی‌خواهند بروند و به‌صورت محلی در اکوسیستم خود، یک سرویس مدیریت‌شده، مستقر شوند، اما تا مدتی دیگر عرضه نخواهد شد.» گفت.

ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معامله کنند. جلسات توجیهی ما را کشف کنید.