OpenAI، پیشگام در زمینه هوش مصنوعی (AI)، قرارداد مجوزی را با آسوشیتدپرس (AP) امضا کرده است تا از آرشیو داستان متنی گسترده AP برای آموزش سیستمهای هوش مصنوعی خود استفاده کند. OpenAI به آرشیو داستان متنی AP دسترسی خواهد داشت که به سال 1985 باز می گردد، به لطف این توافق پیشگامانه.
مدت قرارداد دو ساله بین OpenAI و AP مشخص نیستو نه قیمت خرید. به عنوان بخشی از این توافق، AP دسترسی OpenAI به کتابخانه داستان های متنی خود را فراهم می کند که می تواند برای آموزش سیستم های هوش مصنوعی خود استفاده شود. در ازای آن، OpenAI به AP دسترسی به فناوری خود را می دهد که می تواند از آن برای آزمایش راه هایی برای افزایش کیفیت گزارش خود استفاده کند.
برخی از پوشش های ورزشی محلی و گزارش های درآمد مالی در AP سال ها به طور خودکار تولید شده اند. با این حال، فناوری “تولید کننده” (چت ربات مانند ChatGPT) هستند توسط AP در فرآیند گزارش خود استفاده نمی شود.
وجود دارد مناقشه رو به رشد در دنیای فناوری در مورد استفاده از محتوای دارای حق چاپ برای آموزش هوش مصنوعی. «مدلهای زبان بزرگ» که به رباتهای چت در OpenAI، Google و سایر شرکتهای هوش مصنوعی کمک میکنند، بر اساس میلیاردها جمله از اینترنت عمومی آموزش داده شدند. این مدلها محتوای شخص ثالث مانند مقالههای خبری، مدخلهای ویکیپدیا، نظرات رسانههای اجتماعی و پستهای وبلاگ را بدون اطلاع یا رضایت نویسندگان ترکیب میکنند.
تعداد فزاینده ای از نویسندگان، نوازندگان، رسانه های خبری و شرکت های رسانه های اجتماعی مخالف استفاده از کار خود برای آموزش هوش مصنوعی هستند، ادعا می کند که این نشان دهنده یک تغییر اساسی در ماهیت اینترنت است. آنها ادعا می کنند که ابزار هوش مصنوعی در حال حاضر برای جایگزینی انسان با یادگیری از محتوای ساخته شده توسط انسان استفاده می شود. از آن زمان، سیل پرونده های قضایی علیه این صنعت تشکیل شده است، از جمله شکایت های دسته جمعی علیه OpenAI و Google و شکایت های فردی علیه OpenAI توسط کمدین سارا سیلورمن و دو نویسنده برجسته داستان.
FTC همچنین تحقیقاتی را در مورد استفاده OpenAI از داده های مشتریان برای آموزش مدل آغاز کرده است. FTC اسنادی را درخواست کرده است که جزئیات تلاش های OpenAI برای کاهش تهدیدات احتمالی برای امنیت مدل های هوش مصنوعی خود را نشان دهد و توضیحی در مورد تلاش های این شرکت برای بهبود دقت مدل های زبانی خود را درخواست کرده است، که نشان داده شده است که در هنگام پرسیدن سوال “توهم” می کنند. که جواب آن را نمی دانند.
از آنجایی که رباتهای چت مانند ChatGPT بر روی مجموعه ای ثابت از دادهها آموزش میبینند، نمیتوانند اطلاعات جدید را بدون آموزش مجدد در خود جای دهند. این باعث می شود آنها منابع کمتر قابل اعتمادی از اطلاعات به روز و اخبار فوری داشته باشند. برای رفع این مشکل، برخی از شرکت های فناوری این کار را انجام داده اند سیستمهای پیادهسازی شدهای که به رباتهای چت اجازه میدهند جستجوهای وب خود را انجام دهند یا از یک پایگاه داده جداگانه و دائماً بهروز شده، پاسخ دریافت کنند.
توافق بین دو طرف فقط به OpenAI اجازه دسترسی به آرشیو AP را می دهد، اما این آرشیو به طور مرتب با اخبار فوری به روز می شود. شرکتهای فناوری در گذشته برای مقالات خبری پول پرداخت میکردند، اما معمولاً برای هدفی متفاوت. هم گوگل و هم فیسبوک در برخی کشورها به سازمان های خبری برای حق نمایش مستقیم محتوای خود در پلتفرم هایشان پول می دهند. دولت استرالیا قانونی را تصویب کرده است که این رویه را الزامی می کند و لایحه ای در کانادا نیز همین کار را می کند.
هم OpenAI و هم آسوشیتدپرس نسبت به توسعه هوش مصنوعی ابراز خوش بینی کرده و اعلام کرده است که “به ایجاد و استفاده مسئولانه از این سیستم های هوش مصنوعی اعتقاد دارند.” اگرچه AP نزدیک به یک دهه است که از هوش مصنوعی در ظرفیتهای مختلف، از جمله برای خودکار کردن گزارشهای درآمد شرکتها و جمعبندی برخی رویدادهای ورزشی استفاده کرده است، اما اعلام کرده است که در حال حاضر از هیچ هوش مصنوعی مولد در داستانهای خبری خود استفاده نمیکند.
همچنین اخیراً جستجوی آرشیو تصاویر مبتنی بر هوش مصنوعی را راه اندازی کرده و برنامه ای را مدیریت می کند که به سازمان های خبری محلی در ادغام هوش مصنوعی در عملیات خود کمک می کند. آسوشیتدپرس قویاً سیستمی را تأیید می کند که از مالکیت معنوی محافظت می کند و تضمین می کند که نویسندگان به طور عادلانه برای تلاش های خود دستمزد دریافت می کنند.
آندرس ساویکی، استاد حقوق مالکیت فکری دانشگاه میامی، گفت: «مجموعههای داده شامل محتوای زیادی است که دارای حق چاپ است. دارندگان حق چاپ این سوء استفاده ها را تایید نمی کنند. تصور معاملات بیشتری مانند AP که بین شرکت های فناوری و تولیدکنندگان محتوا در تلاش برای ایجاد یک “پایگاه داده تمیز” انجام می شود، دشوار نیست. مشکل این است که مجموعه دادههای مورد نیاز برای آموزش مدلها به قدری عظیم است که من شک دارم که بتوان مجوز تعداد کافی از مالکان را برای عملی کردن فناوری تضمین کرد.
در نتیجه، توافق بین OpenAI و AP نقطه عطفی است که ممکن است سایر شرکتهای فناوری را تشویق کند تا برای محتوا برای آموزش الگوریتمهای هوش مصنوعی خود هزینه بپردازند. همچنین بر فوریت فزاینده حل مسئله جبران محتوا در بخش هوش مصنوعی تاکید می کند. OpenAI، آسوشیتدپرس، و دیگر رهبران فکری متعهد هستند که سیستمهای هوش مصنوعی را حتی در زمانی که بحثها ادامه دارد، توسعه داده و مسئولانه استفاده کنند.
اولین بار گزارش شد واشنگتن پست
سوالات متداول
س: توافق بین OpenAI و Associated Press (AP) چیست؟
پاسخ: OpenAI یک قرارداد مجوز با آسوشیتدپرس امضا کرده است تا از آرشیو داستان متنی گسترده AP برای آموزش سیستم های هوش مصنوعی خود استفاده کند.
س: مدت قرارداد بین OpenAI و AP چقدر است؟
پاسخ: مدت قرارداد دو ساله بین OpenAI و AP مشخص نیست.
س: OpenAI از طریق توافقنامه به چه محتوایی دسترسی خواهد داشت؟
پاسخ: OpenAI به کتابخانه داستان های متنی AP، که شامل مقالات خبری و سایر محتوای متنی است، دسترسی خواهد داشت.
س: AP از این توافق چه سودی می برد؟
پاسخ: در ازای دسترسی به آرشیو داستان متنی AP، OpenAI دسترسی AP را به فناوری خود فراهم می کند. AP می تواند از این فناوری برای کشف راه هایی برای افزایش کیفیت گزارش خود استفاده کند.
س: آیا AP در گزارش های خود از فناوری هوش مصنوعی مولد استفاده می کند؟
پاسخ: خیر، AP در حال حاضر از فناوری هوش مصنوعی مولد، مانند رباتهای گفتگو، در داستانهای خبری خود استفاده نمیکند. با این حال، از فناوری اتوماسیون برای کارهایی مانند ایجاد برخی پوششهای ورزشی محلی و گزارشهای درآمد مالی استفاده کرده است.
س: بحث در مورد استفاده از محتوای دارای حق چاپ برای آموزش هوش مصنوعی چیست؟
ج: در مورد استفاده از محتوای دارای حق چاپ، مانند مقالات خبری، برای آموزش مدل های هوش مصنوعی، بحث و جدل فزاینده ای وجود دارد. منتقدان استدلال می کنند که ترکیب محتوای شخص ثالث بدون اطلاع یا رضایت نویسندگان نشان دهنده تغییر قابل توجهی در ماهیت اینترنت است و نگرانی هایی را در مورد حقوق مالکیت معنوی ایجاد می کند.
س: چه کسی علیه استفاده از کار آنها برای آموزش هوش مصنوعی صحبت کرده است؟
پاسخ: نویسندگان، نوازندگان، رسانههای خبری و شرکتهای رسانههای اجتماعی درباره استفاده از کارشان برای آموزش مدلهای هوش مصنوعی بدون اجازه آنها ابراز نگرانی کردهاند. برخی از آنها شکایت هایی از جمله شکایت های دسته جمعی علیه OpenAI و Google و همچنین شکایت های فردی را علیه OpenAI توسط سارا سیلورمن کمدین و دو نویسنده داستان تنظیم کرده اند.
س: FTC در مورد OpenAI چه تحقیقاتی را آغاز کرده است؟
پاسخ: FTC تحقیقاتی را در مورد استفاده OpenAI از داده های مشتری برای آموزش مدل آغاز کرده است. آنها به ویژه به درک تلاش های OpenAI برای کاهش تهدیدات احتمالی برای امنیت مدل های هوش مصنوعی و بهبود دقت مدل های زبان آن علاقه مند هستند.
اعتبار تصویر ویژه: Unsplash