AP به OpenAI امکان دسترسی به آرشیو گسترده اخبار خود را می دهد


OpenAI، پیشگام در زمینه هوش مصنوعی (AI)، قرارداد مجوزی را با آسوشیتدپرس (AP) امضا کرده است تا از آرشیو داستان متنی گسترده AP برای آموزش سیستم‌های هوش مصنوعی خود استفاده کند. OpenAI به آرشیو داستان متنی AP دسترسی خواهد داشت که به سال 1985 باز می گردد، به لطف این توافق پیشگامانه.

مدت قرارداد دو ساله بین OpenAI و AP مشخص نیستو نه قیمت خرید. به عنوان بخشی از این توافق، AP دسترسی OpenAI به کتابخانه داستان های متنی خود را فراهم می کند که می تواند برای آموزش سیستم های هوش مصنوعی خود استفاده شود. در ازای آن، OpenAI به AP دسترسی به فناوری خود را می دهد که می تواند از آن برای آزمایش راه هایی برای افزایش کیفیت گزارش خود استفاده کند.

برخی از پوشش های ورزشی محلی و گزارش های درآمد مالی در AP سال ها به طور خودکار تولید شده اند. با این حال، فناوری “تولید کننده” (چت ربات مانند ChatGPT) هستند توسط AP در فرآیند گزارش خود استفاده نمی شود.

وجود دارد مناقشه رو به رشد در دنیای فناوری در مورد استفاده از محتوای دارای حق چاپ برای آموزش هوش مصنوعی. «مدل‌های زبان بزرگ» که به ربات‌های چت در OpenAI، Google و سایر شرکت‌های هوش مصنوعی کمک می‌کنند، بر اساس میلیاردها جمله از اینترنت عمومی آموزش داده شدند. این مدل‌ها محتوای شخص ثالث مانند مقاله‌های خبری، مدخل‌های ویکی‌پدیا، نظرات رسانه‌های اجتماعی و پست‌های وبلاگ را بدون اطلاع یا رضایت نویسندگان ترکیب می‌کنند.

تعداد فزاینده ای از نویسندگان، نوازندگان، رسانه های خبری و شرکت های رسانه های اجتماعی مخالف استفاده از کار خود برای آموزش هوش مصنوعی هستند، ادعا می کند که این نشان دهنده یک تغییر اساسی در ماهیت اینترنت است. آنها ادعا می کنند که ابزار هوش مصنوعی در حال حاضر برای جایگزینی انسان با یادگیری از محتوای ساخته شده توسط انسان استفاده می شود. از آن زمان، سیل پرونده های قضایی علیه این صنعت تشکیل شده است، از جمله شکایت های دسته جمعی علیه OpenAI و Google و شکایت های فردی علیه OpenAI توسط کمدین سارا سیلورمن و دو نویسنده برجسته داستان.

FTC همچنین تحقیقاتی را در مورد استفاده OpenAI از داده های مشتریان برای آموزش مدل آغاز کرده است. FTC اسنادی را درخواست کرده است که جزئیات تلاش های OpenAI برای کاهش تهدیدات احتمالی برای امنیت مدل های هوش مصنوعی خود را نشان دهد و توضیحی در مورد تلاش های این شرکت برای بهبود دقت مدل های زبانی خود را درخواست کرده است، که نشان داده شده است که در هنگام پرسیدن سوال “توهم” می کنند. که جواب آن را نمی دانند.

از آنجایی که ربات‌های چت مانند ChatGPT بر روی مجموعه ای ثابت از داده‌ها آموزش می‌بینند، نمی‌توانند اطلاعات جدید را بدون آموزش مجدد در خود جای دهند. این باعث می شود آنها منابع کمتر قابل اعتمادی از اطلاعات به روز و اخبار فوری داشته باشند. برای رفع این مشکل، برخی از شرکت های فناوری این کار را انجام داده اند سیستم‌های پیاده‌سازی شده‌ای که به ربات‌های چت اجازه می‌دهند جستجوهای وب خود را انجام دهند یا از یک پایگاه داده جداگانه و دائماً به‌روز شده، پاسخ دریافت کنند.

توافق بین دو طرف فقط به OpenAI اجازه دسترسی به آرشیو AP را می دهد، اما این آرشیو به طور مرتب با اخبار فوری به روز می شود. شرکت‌های فناوری در گذشته برای مقالات خبری پول پرداخت می‌کردند، اما معمولاً برای هدفی متفاوت. هم گوگل و هم فیسبوک در برخی کشورها به سازمان های خبری برای حق نمایش مستقیم محتوای خود در پلتفرم هایشان پول می دهند. دولت استرالیا قانونی را تصویب کرده است که این رویه را الزامی می کند و لایحه ای در کانادا نیز همین کار را می کند.

هم OpenAI و هم آسوشیتدپرس نسبت به توسعه هوش مصنوعی ابراز خوش بینی کرده و اعلام کرده است که “به ایجاد و استفاده مسئولانه از این سیستم های هوش مصنوعی اعتقاد دارند.” اگرچه AP نزدیک به یک دهه است که از هوش مصنوعی در ظرفیت‌های مختلف، از جمله برای خودکار کردن گزارش‌های درآمد شرکت‌ها و جمع‌بندی برخی رویدادهای ورزشی استفاده کرده است، اما اعلام کرده است که در حال حاضر از هیچ هوش مصنوعی مولد در داستان‌های خبری خود استفاده نمی‌کند.

همچنین اخیراً جستجوی آرشیو تصاویر مبتنی بر هوش مصنوعی را راه اندازی کرده و برنامه ای را مدیریت می کند که به سازمان های خبری محلی در ادغام هوش مصنوعی در عملیات خود کمک می کند. آسوشیتدپرس قویاً سیستمی را تأیید می کند که از مالکیت معنوی محافظت می کند و تضمین می کند که نویسندگان به طور عادلانه برای تلاش های خود دستمزد دریافت می کنند.

آندرس ساویکی، استاد حقوق مالکیت فکری دانشگاه میامی، گفت: «مجموعه‌های داده شامل محتوای زیادی است که دارای حق چاپ است. دارندگان حق چاپ این سوء استفاده ها را تایید نمی کنند. تصور معاملات بیشتری مانند AP که بین شرکت های فناوری و تولیدکنندگان محتوا در تلاش برای ایجاد یک “پایگاه داده تمیز” انجام می شود، دشوار نیست. مشکل این است که مجموعه داده‌های مورد نیاز برای آموزش مدل‌ها به قدری عظیم است که من شک دارم که بتوان مجوز تعداد کافی از مالکان را برای عملی کردن فناوری تضمین کرد.

در نتیجه، توافق بین OpenAI و AP نقطه عطفی است که ممکن است سایر شرکت‌های فناوری را تشویق کند تا برای محتوا برای آموزش الگوریتم‌های هوش مصنوعی خود هزینه بپردازند. همچنین بر فوریت فزاینده حل مسئله جبران محتوا در بخش هوش مصنوعی تاکید می کند. OpenAI، آسوشیتدپرس، و دیگر رهبران فکری متعهد هستند که سیستم‌های هوش مصنوعی را حتی در زمانی که بحث‌ها ادامه دارد، توسعه داده و مسئولانه استفاده کنند.

اولین بار گزارش شد واشنگتن پست

سوالات متداول

س: توافق بین OpenAI و Associated Press (AP) چیست؟

پاسخ: OpenAI یک قرارداد مجوز با آسوشیتدپرس امضا کرده است تا از آرشیو داستان متنی گسترده AP برای آموزش سیستم های هوش مصنوعی خود استفاده کند.

س: مدت قرارداد بین OpenAI و AP چقدر است؟

پاسخ: مدت قرارداد دو ساله بین OpenAI و AP مشخص نیست.

س: OpenAI از طریق توافقنامه به چه محتوایی دسترسی خواهد داشت؟

پاسخ: OpenAI به کتابخانه داستان های متنی AP، که شامل مقالات خبری و سایر محتوای متنی است، دسترسی خواهد داشت.

س: AP از این توافق چه سودی می برد؟

پاسخ: در ازای دسترسی به آرشیو داستان متنی AP، OpenAI دسترسی AP را به فناوری خود فراهم می کند. AP می تواند از این فناوری برای کشف راه هایی برای افزایش کیفیت گزارش خود استفاده کند.

س: آیا AP در گزارش های خود از فناوری هوش مصنوعی مولد استفاده می کند؟

پاسخ: خیر، AP در حال حاضر از فناوری هوش مصنوعی مولد، مانند ربات‌های گفتگو، در داستان‌های خبری خود استفاده نمی‌کند. با این حال، از فناوری اتوماسیون برای کارهایی مانند ایجاد برخی پوشش‌های ورزشی محلی و گزارش‌های درآمد مالی استفاده کرده است.

س: بحث در مورد استفاده از محتوای دارای حق چاپ برای آموزش هوش مصنوعی چیست؟

ج: در مورد استفاده از محتوای دارای حق چاپ، مانند مقالات خبری، برای آموزش مدل های هوش مصنوعی، بحث و جدل فزاینده ای وجود دارد. منتقدان استدلال می کنند که ترکیب محتوای شخص ثالث بدون اطلاع یا رضایت نویسندگان نشان دهنده تغییر قابل توجهی در ماهیت اینترنت است و نگرانی هایی را در مورد حقوق مالکیت معنوی ایجاد می کند.

س: چه کسی علیه استفاده از کار آنها برای آموزش هوش مصنوعی صحبت کرده است؟

پاسخ: نویسندگان، نوازندگان، رسانه‌های خبری و شرکت‌های رسانه‌های اجتماعی درباره استفاده از کارشان برای آموزش مدل‌های هوش مصنوعی بدون اجازه آنها ابراز نگرانی کرده‌اند. برخی از آنها شکایت هایی از جمله شکایت های دسته جمعی علیه OpenAI و Google و همچنین شکایت های فردی را علیه OpenAI توسط سارا سیلورمن کمدین و دو نویسنده داستان تنظیم کرده اند.

س: FTC در مورد OpenAI چه تحقیقاتی را آغاز کرده است؟

پاسخ: FTC تحقیقاتی را در مورد استفاده OpenAI از داده های مشتری برای آموزش مدل آغاز کرده است. آنها به ویژه به درک تلاش های OpenAI برای کاهش تهدیدات احتمالی برای امنیت مدل های هوش مصنوعی و بهبود دقت مدل های زبان آن علاقه مند هستند.

اعتبار تصویر ویژه: Unsplash

برد اندرسون

سردبیر در ReadWrite

براد ویرایشگری است که بر محتوای ارائه شده در ReadWrite.com نظارت می کند. او قبلاً به عنوان ویراستار در PayPal و Crunchbase کار می کرد. می توانید با او در برد در readwrite.com تماس بگیرید.