منوعات

دعاوى قضائية جديدة ضد شركة OpenAI إثر مساعيها المتكررة لتدريب الذكاء الصناعي

تستخدم OpenAI البيانات المتاحة للعامة لتدريب ChatGPT، بما في ذلك الكتب والمقالات المنشورة عبر الإنترنت، لكن مؤلفي هذه الأعمال يطالبون الآن بحقهم في الحصول على أموال مقابل ذلك.

تعد بيانات التدريب جزءًا أساسيًا من عملية نمذجة الذكاء الاصطناعي التي تجتاح عالم التكنولوجيا، ولهذا السبب سارعت شركات التكنولوجيا الرائدة مثل Google وMeta وOpenAI وAnthropic وMicrosoft إلى العثور على مصادر جديدة للبيانات. في مرحلة ما، فكرت Meta حتى في شراء دار نشر كبيرة تسمى Simon & Schuster.

كيف يكون الاستخدام عادلا؟

أحد الأسباب الرئيسية للمشكلة هو أن الناشرين يتهمون هذه الشركات الآن بأخذ بيانات محمية بحقوق الطبع والنشر، ولذلك يطالبون بالدفع مقابل أعمالهم، لكن Meta وOpenAI صرحا لمكتب حقوق الطبع والنشر الأمريكي أن وضع المواد المحمية بحقوق الطبع والنشر على الإنترنت يجعلها متاحة للجمهور ، وبالتالي يعتبر استخدامه استخدامًا عادلاً.

لكن لا يزال يتعين على هاتين الشركتين عرض قضيتهما في المحكمة، حيث قامت عدة شركات برفع دعاوى قضائية ضدهما بشأن مواد محمية بحقوق الطبع والنشر.

 

في بداية هذا العام، رفع مركز التحقيقات الاستقصائية، وهي منظمة إخبارية غير ربحية، دعوى قضائية ضد OpenAI ومايكروسوفت في المحكمة الفيدرالية، متهماً OpenAI باستغلال الأعمال المحمية بحقوق الطبع والنشر والتي تنتمي إلى مؤلفين آخرين من مختلف أنحاء العالم، بما في ذلك أشخاص من المركز نفسه.

واتهم محامو المركز شركتي OpenAI ومايكروسوفت باستخدام مواد محمية بحقوق الطبع والنشر من شركة اندمج معها المركز لتدريب نماذج الذكاء الاصطناعي في تطبيقات GPT وCopilot.

بدلات جملة

وفي بيان حول القضية، قالت مونيكا بورلين، المديرة التنفيذية للمركز: “بدأت شركتا OpenAI وMicrosoft في أخذ أخبارنا لجعل منتجاتهما أقوى، دون طلب إذن أو تقديم أي تعويض، على عكس الشركات الأخرى التي تطلب الإذن باستخدام موادنا”. . هذا النهج المجاني للجميع غير عادل تمامًا ويشكل انتهاكًا لحقوق الطبع والنشر.

وذكرت الدعوى القضائية أيضًا أنه كان هناك: “16793 عنوانًا واضحًا من نطاق موقع الشركة على الويب في قائمة منشورة لأفضل نطاقات الويب، كجزء من مجموعة تدريب نص الويب الخاصة بالشركة”.

وفي قضية منفصلة رفعتها نقابة الكتاب، زعم مؤلفان أن الشركة استخدمت معلومات من كتبهما لتدريب ChatGPT، ورفعت صحيفة نيويورك تايمز دعوى قضائية مماثلة ضد الشركة في ديسمبر 2023.

في مايو/أيار الماضي، كشفت وثائق المحكمة المتعلقة بدعوى نقابة الكتاب أن شركة OpenAI حذفت مجموعتين كبيرتين من البيانات استخدمتهما لتدريب GPT-3، ويعتقد محامو النقابة أن هاتين المجموعتين تحتويان على “أكثر من 100 ألف كتاب منشور”، كما جاء في وثائق المحكمة أن الموظفين… المسؤولون عن جمع هذه البيانات لا يعملون الآن لدى OpenAI.

رخصة الاستخدام

وقد بدأت شركة OpenAI بالفعل في توقيع اتفاقيات ترخيص مع المؤسسات الإخبارية لاستخدام عملها بشكل عادل، كما وقعت اتفاقيات مماثلة مع وكالة أسوشيتد برس، وصحيفة وول ستريت جورنال، ونيويورك بوست، وأتلانتيك، وبريسا ميديا، ولوموند، وفايننشال تايمز، وبزنس. Insider، وأكبر شركة صحف وتوزيع في ألمانيا، Axel Springer.

البيانات المركبة

ومع ذلك، فإن مقدار المحتوى المطلوب لتدريب هذه الروبوتات بشكل مستمر يتطلب العديد من اتفاقيات الترخيص، ولكن هناك حل يتمثل في البيانات الاصطناعية، وهي البيانات التي يتم إنشاؤها بشكل مصطنع بدلاً من جمعها من العالم الحقيقي، بحيث يمكن توليدها بسهولة عن طريق التعلم الآلي. خوارزميات.

ايلون ماسك

لقد اعتبرت شركة OpenAI البيانات الاصطناعية خيارًا لتدريب نماذجها، لكن رئيسها التنفيذي، سام ألتمان، لديه مخاوف بشأن جودة البيانات الناتجة. وقال في مؤتمر تقني في مايو 2023: “طالما يمكنك تجاوز حد البيانات الاصطناعية، وهو عندما يكون النموذج ذكيًا بما يكفي لإنتاج بيانات تركيبية جيدة، ستكون الأمور على ما يرام”. استكشفت إمكانية تعاون النماذج، بحيث يقوم أحد أنظمة الذكاء الاصطناعي بإنتاج البيانات وآخر بالحكم عليها.

ومن الجدير بالذكر أن شركة OpenAI لم ترد حتى الآن على طلب موقع Business Insider التعليق على الأمر.

للمزيد : تابع خليجيون 24 ، وللتواصل الاجتماعي تابعنا علي فيسبوك وتويتر

مقالات ذات صلة

زر الذهاب إلى الأعلى
Open chat
1
Scan the code
مرحبا 👋
أهلاً! كيف يمكننا مساعدتك؟