تقود نحو 245 مؤسسة إعلامية في تسعة بلدان حملة واسعة لحجب روبوتات الزحف التابعة لمنظمة “Internet Archive”، التي تضم أرشيفها الشهير “Wayback Machine” أكثر من تريليون صفحة إنترنت مؤرخة منذ عام 1996.
قررت 245 مؤسسة إعلامية في تسعة بلدان منع “Internet Archive” من أرشفة محتواها، في خطوة تستهدف حماية مقالاتها من أن ينتهي بها المطاف كوقود مجاني لتدريب أنظمة الذكاء الاصطناعي.
ويضم أرشيف المنظمة الشهير “Wayback Machine” أكثر من تريليون صفحة إنترنت منذ عام 1996، بينها مواد تعود قديمة لعمالقة الإعلام مثل “CNN” و”The New York Times” و”The Guardian” و”USA Today”.
وتأتي هذه الحملة بعدما بدأت شركات الذكاء الاصطناعي باستخدام المحتوى المؤرشف لتدريب النماذج اللغوية الكبيرة دون إذن أو مقابل مالي. ويكشف تحليل أجرته شركة “Originality AI” أن أكثر من 20 مؤسسة إعلامية كبرى تحجب بالفعل روبوت الزحف الرئيسي “ia_archiverbot”، فيما يمتد الحجب ليشمل واحداً على الأقل من روبوتات الأرشيف الأربعة من جانب 241 موقعاً إخبارياً عالمياً.
“يو إس إيه توداي” تسحب مئات الصحف المحلية من السجل التاريخي
يعود جزء كبير من المواقع المحجوبة إلى شركة “USA Today Co”، أكبر ناشر صحف في الولايات المتحدة، مما يعني أن مئات الصحف المحلية أزيحت عملياً من السجل التاريخي العام.
ويؤكد مدير “Wayback Machine” مارك غراهام أن مؤسسته ليست سوى “أضرار جانبية” في هذه المعركة، متهماً شركات الذكاء الاصطناعي بأنها المستخدم الحقيقي الذي يصل إلى المحتوى القديم عبر واجهات الأرشيف.
ورداً على هذا الاستغلال، اتخذ الأرشيف إجراءات دفاعية شملت منع تنزيل كميات كبيرة من مواد بعض المواقع وتقييد الاستخراج الآلي للبيانات.
“نيويورك تايمز”: محتوانا يُستغل للمنافسة معنا مباشرة
قال غراهام جيمس، المتحدث باسم صحيفة “The New York Times”، إن “محتوى الصحيفة الموجود على الأرشيف يُستغل من شركات الذكاء الاصطناعي في انتهاك لقانون حقوق النشر، للمنافسة معنا بشكل مباشر”.
وأضاف أن الصحيفة “تستثمر قدراً هائلاً من الموارد في إنتاج صحافة أصلية، ولا يجوز استخدام هذا العمل دون إذن”. في المقابل، تبنت مؤسسات أخرى مثل “The Guardian” نهجاً أكثر توازناً عبر تقييد الوصول بدلاً من الحجب الكامل، في محاولة لإيجاد تسوية تحفظ حقوق النشر دون التضحية بالأرشيف التاريخي.
100 صحفي يوقعون عريضة احتجاج
أطلقت منظمة “Fight for the Future” الحقوقية عريضة وقعها 100 صحفي يعملون حالياً، احتجاجاً على سياسات الحجب التي يرون أنها تهدد السجل العام.
ويحذر غراهام من أنه دون الأرشيف، يمكن تعديل المقالات غير المؤرشفة دون مساءلة، سواء بتغيير الاقتباسات أو حذفها أو إعادة توجيه التصريحات الرسمية. وتقوم “Wayback Machine” حالياً برصد هذه التغييرات وتوثيقها، فيما تتفاقم السجالات حول مستقبل السجلات العامة وكتابة التاريخ في عصر الذكاء الاصطناعي.
ويرى مراقبون أن المعركة الحالية ترسم خطاً فاصلاً بين حق الجمهور في الوصول إلى الأرشيف وحق المؤسسات الإعلامية في حماية محتواها من الاستغلال التجاري غير المصرح به.