أخبار عاجلة
التغطية الاجتماعية تصل للتعليم الأولي -
برشيد تشهد انقطاع الماء الشروب -

تقرير.. كيف دمرت أنثروبيك ملايين الكتب لتدريب ذكائها الاصطناعي؟

تقرير.. كيف دمرت أنثروبيك ملايين الكتب لتدريب ذكائها الاصطناعي؟
تقرير.. كيف دمرت أنثروبيك ملايين الكتب لتدريب ذكائها الاصطناعي؟

كشفت وثائق قضائية أمريكية أن شركة أنثروبيك، المطورة للمساعد الذكي “Claude”، أنفقت ملايين الدولارات على شراء كتب ورقية بهدف تمزيقها ومسحها ضوئيًا لتدريب نماذج الذكاء الاصطناعي الخاص بها.

وبحسب الوثائق، فقد عيّنت الشركة في أوائل عام 2024 توم تيرفي، المسؤول السابق عن مشروع “كتب جوجب”، وكلفته بمهمة جمع “كافة كتب العالم”. واتبعت الشركة أسلوب المسح المدمر “Destructive Scanning”، إذ أزالت أغلفة الكتب، وقطّعت الصفحات لتسهيل مسحها ضوئيًا، ثم تخلّصت من النسخ الورقية كاملةً بعد تحويلها إلى ملفات رقمية داخلية.

ومع أن هذا النهج يُستخدم أحيانًا في عمليات الأرشفة الصغيرة، فإن اعتماد أنثروبيك عليه على نطاق واسع يُعدّ استثناءً لافتًا يعكس تفضيلها السرعة وتقليل التكلفة.

وحكم القاضي ويليام ألسوب بأن العملية تندرج ضمن الاستخدام العادل، مشيرًا إلى أن أنثروبيك اشترت الكتب بطريقة قانونية، ولم تنشر النسخ الرقمية الممسوحة، بل استخدمتها داخليًا فقط. وعدّ القاضي أن تدمير النسخ الورقية بعد تحويلها إلى صيغة رقمية لا يخالف القانون.

وأوضح القاضي أيضًا أن أنثروبيك لم تتبع هذا النهج القانوني منذ البداية، إذ اعتمدت في مراحل سابقة على نسخ مقرصنة من الكتب الرقمية لتسريع عملية جمع البيانات، وهو ما أضعف موقفها القانوني أمام دعاوى انتهاك حقوق النشر.

وتسعى شركات الذكاء الاصطناعي إلى تغذية نماذج اللغة الكبيرة (LLMs) بمليارات الكلمات المستخرجة من نصوص ذات جودة عالية مثل الكتب والمقالات التي تُعد ضرورية لتحسين دقة النموذج واستجابته. لكن هذه النصوص غالبًا ما تخضع لحقوق نشر، مما يدفع بعض الشركات إلى تجنّب التفاوض مع الناشرين باللجوء إلى حلول بديلة.

ومن بين تلك البدائل ما يُعرف بـ”حق البيع الأول” الذي يسمح للمشتري باستخدام النسخة المادية كما يشاء، وتمزيقها ومسحها ضوئيًا. وقد استفادت أنثروبيك من هذا المبدأ القانوني لتجنّب تعقيدات الترخيص، واشترت كميات ضخمة من الكتب المستعملة من متاجر كبرى مقابل ملايين الدولارات.

وكانت أنثروبيك تتلف الكتب بعد مسحها، في حين تتبنى جهات أخرى طرقًا غير مدمّرة للحفاظ على الأصول الورقية. على سبيل المثال، تستخدم منصة “أرشيف الإنترنت” تقنيات تضمن الحفاظ على النسخة الأصلية إلى جانب النسخة الرقمية، كما أعلنت شركتا OpenAI ومايكروسوفت تعاونًا مع مكتبات جامعة هارفارد لتدريب نماذج الذكاء الاصطناعي على نحو مليون كتاب من المجال العام يعود تاريخها إلى القرن الخامس عشر دون تدمير أي نسخة منها.

نسخ الرابط تم نسخ الرابط

اشترك فى النشرة البريدية لتحصل على اهم الاخبار بمجرد نشرها

تابعنا على مواقع التواصل الاجتماعى

السابق نتيجة مباراة باريس سان جيرمان ضد سياتل اليوم.. الفرنسي يحسم المواجهة بثنائية نظيفة ويعتلي صدارة مجموعته
التالى حضرت احتفالية.. محامي نوال الدجوي يرد على تحدي الخصوم: "الدجوي في كامل قواها العقلية