OpenAI برای آموزش LLM در مورد محتوای فایننشال تایمز


فایننشال تایمز (افشای کامل – صاحبان وب بعدی) با OpenAI معامله کرده اند. این شرکت آمریکایی از محتوای این ناشر بریتانیایی برای آموزش مدل‌های هوش مصنوعی خود استفاده خواهد کرد.

این قرارداد جدیدترین مجموعه از همکاری های جدید بین OpenAI و ناشران خبری جهانی مانند Axel Springer، Associated Press و Le Monde است. شرکت شرایط مالی هیچ یک از قراردادها را فاش نمی کند.

تنها در سال 2023، صدها صفحه دادخواست و مقالات بی‌شماری شرکت‌های فناوری را به سرقت آثار هنرمندان و ناشران برای آموزش مدل‌های هوش مصنوعی متهم می‌کنند.

OpenAI به دلیل آموزش مدل های GPT خود بر روی محتوایی که بدون رضایت از وب حذف شده است، مورد انتقاد قرار گرفته است. سال گذشته، نیویورک تایمز حتی از OpenAI و مایکروسافت به دلیل نقض حق چاپ شکایت کرد.

روابط اخیر OpenAI با ناشران به آن اجازه می دهد تا به آموزش الگوریتم های خود در مورد محتوای وب ادامه دهد. اما این بار اجازه وجود خواهد داشت.

همکاری استراتژیک

FT معامله با OpenAI را “مشارکت استراتژیک” نامید.

بیش از 100 میلیون کاربر ChatGPT دسترسی مستقیم به چکیده مقاله، نقل قول ها و پیوندهای ناشر خواهند داشت. این محتوا معمولاً در پشت یک paywall پنهان می شود. OpenAI تمام اطلاعات از FT را به پست نسبت می دهد.

در مقابل، OpenAI به سازمان خبری کمک خواهد کرد تا ابزارهای جدید هوش مصنوعی را توسعه دهد. FT در حال حاضر از محصولات OpenAI، از جمله ChatGPT Enterprise استفاده می کند، ما می توانیم تأیید کنیم.

مطلب پیشنهادی  LLM ها به سلاح جنگ اطلاعاتی تبدیل شده اند

جان ریدینگ، مدیر اجرایی گروه اف تی، گفت که ناشر همچنان به “ژورنالیسم انسانی” متعهد است.

ریدینگ گفت: «این یک توافق مهم از چند جهت است. این امر ارزش روزنامه‌نگاری برنده جوایز ما را به رسمیت می‌شناسد و به ما بینشی اولیه از نحوه ظهور محتوا از طریق هوش مصنوعی می‌دهد.»

علاوه بر مزایای FT، پیامدهای گسترده تری برای صنعت وجود دارد. البته این درست است که پلتفرم‌های هوش مصنوعی به ناشران برای استفاده از مطالبشان پول بپردازند.» “OpenAI اهمیت شفافیت، تخصیص و جبران خسارت را درک می کند – همه اینها برای ما ضروری است. در عین حال، به وضوح به نفع مصرف کنندگان است که این محصولات حاوی منابع قابل اعتماد باشند.”

استفاده منصفانه یا ناعادلانه؟

اما صرفاً به این دلیل که OpenAI از ناشران اطاعت می کند به این معنی نیست که همچنان اطلاعات را بدون اجازه از وب استخراج نمی کند.

در اوایل این ماه، نیویورک تایمز گزارش داد که OpenAI از اسکریپت های یوتیوب برای آموزش مدل های خود استفاده می کند. به گفته این نشریه، این ناقض قوانین کپی رایت است، زیرا سازندگان YouTube که ویدیوها را در این پلتفرم آپلود می‌کنند، همچنان حق نسخه‌برداری محتوایی را که ایجاد می‌کنند حفظ می‌کنند.

با این حال، OpenAI اصرار دارد که استفاده از مواد آنلاین به منزله «استفاده منصفانه» است. این شرکت و بسیاری از شرکت های فناوری دیگر ادعا می کنند که مدل های زبان بزرگ (LLM) آنها اطلاعات جمع آوری شده آنلاین را به چیزی کاملاً جدید تبدیل می کند.

با این حال، همانطور که قبلاً به طور عمیق گزارش کرده‌ایم، مطالعات نشان می‌دهد که LLMها به طور مداوم بخش‌های بزرگی از متن آموزشی اصلی خود را به‌کلمه بازتولید می‌کنند.

مطلب پیشنهادی  اپل در حال آپلود اولین شبیه ساز در اپ استور در یک دهه اخیر است

تسویه حساب با ناشران می تواند یک گام بالقوه رو به جلو برای اختلافات حق نسخه برداری هوش مصنوعی باشد. با این حال، آنها به احتمال زیاد استثنا باقی خواهند ماند تا قاعده.

آموزش وردپرس

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *