مدل Hub-and-Spoke: جایگزینی برای داده مش


ما هیجان زده هستیم که Transform 2022 را به صورت حضوری در 19 ژوئیه و تقریباً 20 تا 28 ژوئیه بازگردانیم. برای گفتگوهای روشنگر و فرصت های شبکه هیجان انگیز به رهبران هوش مصنوعی و داده بپیوندید. امروز ثبت نام کنید!


مش داده ها یک موضوع داغ در جامعه داده و تجزیه و تحلیل است. مش دیتا که در سال 2020 توسط زمک دهقانی در مقاله خود با عنوان “اصول مش داده و معماری منطقی” معرفی شد، یک مدل توزیع شده جدید برای سازماندهی تیم های تحلیلی برای ارائه محصولات داده است و هدف آن رسیدگی به چالش های داده های متمرکز و غیرمتمرکز است. اما آیا این رویکرد واقعاً بهترین رویکرد برای شرکت های امروزی است؟

مدل های سازمانی برای تجزیه و تحلیل

در طول سال‌ها، ما شاهد مدل‌های سازمانی متمرکز و غیرمتمرکز برای ارائه تجزیه و تحلیل به کسب و کار بوده‌ایم. در حالی که هر دو مدل مزایای خود را دارند، هر کدام دارای معایب شدیدی هستند که آنها را برای برآوردن نیازهای مصرف کنندگان تشنه داده امروزی ناکافی می کند.

1. مدل متمرکز

انبار داده به شرکت‌ها اجازه می‌دهد تا داده‌ها را در یک مکان منفرد ذخیره کنند تا در تئوری، همه بتوانند داده‌های خود را با اطمینان پیدا کنند و جستجو کنند. با کنترل مرکزی بر بستر داده و استانداردها، داده ها را می توان به طور مداوم تعریف کرد و به طور قابل اعتماد تحویل داد.

شکل 1: مدل متمرکز برای مدیریت داده و تجزیه و تحلیل

با این حال، در عمل، چند مشکل بزرگ با این رویکرد وجود دارد. ابتدا، داده‌ها باید به قدری با دقت تنظیم و بارگذاری شوند که فقط IT مهارت‌های لازم برای ساخت انبار داده را داشته باشد. این امر IT را به عنوان یک گلوگاه برای یکپارچه سازی داده های جدید تنظیم می کند. دوم، از آنجایی که تیم فناوری اطلاعات معمولاً کسب‌وکار را درک نمی‌کند، آن‌ها تلاش می‌کنند تا نیازمندی‌های کسب‌وکار را به الزامات فنی تبدیل کنند – و بنابراین تنگنا را تشدید می‌کنند و مشتریان خود را ناامید می‌کنند. در نهایت، کاربران تجاری برای تجزیه و تحلیل هزاران جدول انبار داده تلاش می کنند، و این باعث می شود که انبار داده متمرکز تنها برای پیچیده ترین کاربران جذاب باشد.

2. مدل غیر متمرکز

به دلیل ناامیدی کاربر نهایی و افزایش محبوبیت ابزارهای تجسم مانند Tableau، کاربران تجاری با رویکردی غیرمتمرکز امور را در دست گرفته اند. کاربران تجاری به جای منتظر ماندن برای تحویل داده های IT، استخراج داده ها، مدل های داده و گزارش های خود را ایجاد کرده اند. با تمرکززدایی از آماده سازی داده ها، کاربران تجاری از فناوری اطلاعات رها شدند و از مسئله «گمشده در ترجمه» مرتبط با رویکرد متمرکز و مبتنی بر فناوری اطلاعات اجتناب کردند.

شکل 2: مدل غیرمتمرکز برای مدیریت داده و تجزیه و تحلیل

اما در عمل، این رویکرد، مانند رویکرد متمرکز، چالش‌های عمده‌ای را نیز به همراه داشت. اول، با عدم کنترل بر تعاریف کسب و کار، کاربران تجاری نسخه های خود را از واقعیت با هر داشبوردی که نوشته بودند ایجاد کردند. در نتیجه، تعاریف و نتایج رقابتی کسب و کار، اعتماد و اعتماد مدیریت را به خروجی های تحلیلی از بین برد. دوم، رویکرد غیرمتمرکز باعث گسترش پلتفرم‌ها و ابزارهای رقیب و اغلب ناسازگار شد و ادغام تجزیه و تحلیل در واحدهای تجاری را دشوار یا غیرممکن کرد.

مش داده

مش داده برای رفع چالش های هر دو مدل است. این سازمان می‌پذیرد که داده‌های امروزی توزیع شده‌اند و به همه کاربران یک سازمان اجازه می‌دهد تا بدون دخالت تیم‌های داده‌های خبره، از تقریباً هر منبع داده‌ای به بینش‌های تجاری دسترسی داشته باشند و آن‌ها را تجزیه و تحلیل کنند. این بیشتر بر اساس افراد و سازمان است تا فناوری، به همین دلیل است که بسیار قانع کننده است. معماری توزیع شده یک مش، مالکیت هر حوزه تجاری را غیرمتمرکز می کند. این بدان معنی است که هر دامنه بر کیفیت، حریم خصوصی، تازگی، دقت و انطباق داده ها برای موارد استفاده تحلیلی و عملیاتی کنترل دارد.

رویکرد شبکه داده، با این حال، از یک مدل سازمانی کاملاً غیرمتمرکز با حذف تیم متمرکز به طور کلی حمایت می کند. من می‌خواهم جایگزینی برای این رویکرد پیشنهاد کنم که یک مرکز برتر را معرفی می‌کند تا یک مدل غیرمتمرکز مدیریت داده را برای اکثر شرکت‌ها قابل اجرا کند.

مدل Hub-and-Spoke: جایگزینی برای داده مش

واضح است که هیچ یک از رویکردها، متمرکز یا غیرمتمرکز، نمی توانند چابکی و ثبات را به طور همزمان ارائه دهند. این اهداف در تضاد هستند. با این حال، مدلی وجود دارد که اگر با ابزار و فرآیندهای مناسب پیاده‌سازی شود، می‌تواند بهترین هر دو جهان را ارائه دهد.

مدل “hub-and-spoke” جایگزینی برای معماری شبکه داده با برخی تفاوت‌های اساسی است. یعنی، مدل هاب و اسپیک یک تیم داده مرکزی یا مرکز برتری (“هاب”) را معرفی می کند. این تیم صاحب پلتفرم داده، استانداردهای ابزار و فرآیند است در حالی که تیم های دامنه تجاری (“Spokes”) مالک محصولات داده برای دامنه های خود هستند. این رویکرد پدیده «همه چیز پیش می‌رود» مدل غیرمتمرکز را حل می‌کند، در حالی که به متخصصان موضوع (SMEs) یا مباشران داده قدرت می‌دهد تا به طور مستقل محصولات داده‌ای را ایجاد کنند که نیازهای آنها را برآورده کند.

شکل 3: مدل Hub-and-Spoke برای مدیریت داده و تجزیه و تحلیل

پشتیبانی از یک مدل غیرمتمرکز و هاب برای ایجاد محصولات داده مستلزم آن است که تیم ها به یک زبان داده مشترک صحبت کنند و این زبان SQL نیست. آنچه مورد نیاز است یک است منطقی روشی برای تعریف روابط داده ها و منطق تجاری که از نمایش فیزیکی داده ها جدا و متمایز است. یک مدل داده معنایی یک کاندیدای ایده‌آل برای خدمت به عنوان سنگ روزتا برای تیم‌های حوزه داده‌های متفاوت است، زیرا می‌توان از آن برای ایجاد یک دوقلوی دیجیتالی از کسب‌وکار با نگاشت داده‌های فیزیکی به شرایط تجاری مناسب استفاده کرد. کارشناسان حوزه می‌توانند دانش کسب و کار خود را به شکل دیجیتالی رمزگذاری کنند تا دیگران به جستجو، اتصال و ارتقاء آن بپردازند.

برای اینکه این رویکرد در مقیاس کار کند، اجرای یک پلت فرم لایه معنایی مشترک که از اشتراک مدل داده، ابعاد منطبق، همکاری و مالکیت پشتیبانی می کند، بسیار مهم است. با یک لایه معنایی، تیم داده مرکزی (هاب) می‌تواند مدل‌های مشترک و ابعاد منطبق (یعنی زمان، محصول، مشتری) را تعریف کند، در حالی که کارشناسان حوزه (سخنان) مدل‌های فرآیند کسب‌وکار خود را دارند و تعریف می‌کنند (یعنی «صورت‌حساب»، « حمل و نقل، “سرب ژنرال”). با توانایی به اشتراک گذاری دارایی های مدل، کاربران تجاری می توانند مدل های خود را با مدل هایی از سایر حوزه ها ترکیب کنند تا ترکیبات جدیدی برای پاسخ به سؤالات عمیق تر ایجاد کنند.

شکل 4: ترکیب مدل های مشترک و مدل های خاص دامنه

مدل Hub-and-Spoke موفق می شود زیرا با نقاط قوت تیم های متمرکز و دامنه کسب و کار عمل می کند: تیم متمرکز مالک و راه اندازی پلت فرم فنی است و مدل های مشترک را منتشر می کند، در حالی که تیم های تجاری با استفاده از مجموعه ای ثابت محصولات داده های دامنه خاص را ایجاد می کنند. از تعاریف کسب و کار و بدون نیاز به درک مدل های کسب و کار سایر حوزه ها.

چگونه به آنجا برسیم

حرکت به یک مدل هاب و اسپیک برای ارائه محصولات داده نیازی به ایجاد اختلال ندارد. بسته به مدل موجود شما برای تحویل تجزیه و تحلیل، دو مسیر برای موفقیت وجود دارد.

اگر سازمان تحلیلی فعلی شما است متمرکز، تیم مرکزی و تیم های تجاری باید به طور جمعی حوزه های داده های کلیدی را شناسایی کنند، سرپرستی داده ها را اختصاص دهند و یک مهندس تجزیه و تحلیل را در هر کدام تعبیه کنند. مهندس تجزیه و تحلیل ممکن است از تیم مرکزی یا تیم تجاری باشد. با استفاده از یک پلت فرم لایه معنایی، مهندس تجزیه و تحلیل تعبیه شده می تواند در تیم دامنه تجاری برای ایجاد مدل های داده و محصولات داده برای آن دامنه کار کند. مهندس تجزیه و تحلیل جاسازی شده با تیم داده مرکزی برای تعیین استانداردهایی برای ابزار و پردازش و در عین حال شناسایی مدل های رایج کار می کند.

اگر سازمان فعلی شما است غیر متمرکز، می توانید یک تیم داده مرکزی برای ایجاد استانداردهایی برای ابزارسازی و پردازش ایجاد کنید. علاوه بر مدیریت پلت فرم لایه معنایی و اشیاء و مدل های مشترک آن، تیم داده مرکزی ممکن است خطوط لوله داده و پلت فرم های داده به اشتراک گذاشته شده توسط تیم های دامنه را مدیریت کند.

ساختمان برای مقیاس

مدل سازمانی بهینه برای تجزیه و تحلیل به اندازه و بلوغ سازمان شما بستگی دارد. با این حال، هرگز برای ساخت مقیاس زود نیست. صرف نظر از اینکه چقدر کوچک است، سرمایه گذاری در یک مدل غیرمتمرکز و متمرکز برای ایجاد محصولات داده، اکنون و در آینده سودآوری خواهد داشت. با ترویج نظارت و مالکیت داده توسط متخصصان حوزه، با استفاده از مجموعه‌ای از ابزارها و تعاریف معنایی مشترک، کل سازمان شما برای ایجاد محصولات داده در مقیاس قدرت پیدا می‌کند.

دیوید پی ماریان مدیر ارشد فناوری و یکی از بنیانگذاران است AtScale, Inc.

DataDecisionMakers

به انجمن VentureBeat خوش آمدید!

DataDecisionMakers جایی است که کارشناسان، از جمله افراد فنی که کار داده را انجام می دهند، می توانند بینش ها و نوآوری های مرتبط با داده ها را به اشتراک بگذارند.

اگر می‌خواهید درباره ایده‌های پیشرفته و اطلاعات به‌روز، بهترین شیوه‌ها و آینده فناوری داده و داده مطالعه کنید، به ما در DataDecisionMakers بپیوندید.

حتی ممکن است در نظر داشته باشید که مقاله ای از خودتان مشارکت دهید!

از DataDecisionMakers بیشتر بخوانید