لكي تتمكن OpenAI من تقديم خدمة لائقة من خلال خدمتها الرائدة ChatGPT، فإنها تحتاج إلى جمع كمية هائلة من البيانات عبر الإنترنت. ويتم ذلك من خلال استخدام زاحف الويب المعروف باسم GTBot، ولكن على الرغم من حقيقة أن هذا هو الحال، فقد تبين أن أكثر من ربع أفضل 100 موقع ويب في العالم قد منعت الآن الروبوت من القدرة على كشط البيانات الخاصة بهم.
ولكي نكون أكثر تحديدًا، فقد أغلق 26 موقعًا من بين أفضل 100 موقع ويب أبوابها الآن أمام GTBot، مما يجعل من الصعب على OpenAI أن تضع يديها على البيانات التي تحتاجها مما قد يكون عليه الحال بخلاف ذلك. إذا أردنا توسيع النطاق ليشمل أفضل 1000 موقع ويب، فقد اتخذ 242 موقعًا منهم قرارًا بحظر GTBot بالكامل. وهذا يعني أن هذه النسبة هي نفسها تقريبًا بغض النظر عن إضافة العديد من مواقع الويب إلى المعادلة.
قبل شهر واحد فقط، اتخذ 69 موقعًا فقط من بين أفضل 1000 موقع هذا القرار الجذري مع أخذ كل الأمور في الاعتبار. يشير هذا إلى وجود زيادة هائلة بنسبة 250% في عدد مواقع الويب التي لم تعد مستعدة للامتثال. يتم أيضًا حظر GTBot بنسبة أعلى بكثير من أدوات الكشط الأخرى مثل CCBot وAnthropic AI.
بعد أن قيل كل هذا وتوقف الآن، من المهم أن نلاحظ أن بعضًا من أكبر العلامات التجارية في العالم هي جزء من هذه القائمة. وتشمل هذه المواقع منصة التواصل الاجتماعي Pinterest، والمواقع الإخبارية التابعة لصحيفة The Guardian، وUSA Today، وWashington Post، وCBS News، إلى جانب المواقع الشهيرة مثل Web MD وdictionary.com.
تفعل مواقع الويب ذلك لأن ChatGPT لا يوفر أي مراجع أو مصادر للمعلومات التي يقدمها. يمكن أن يكون هذا ضارًا لأن هذا هو الشيء الذي قد يؤدي في النهاية إلى حرمان مواقع الويب هذه من السمات التي تطلبها للمعلومات التي يقومون بإنشائها بأنفسهم.