تُتَّهَمُ آبل وإنفيديا باستخدام آلاف مقاطع الفيديو المسروقة من يوتيوب لتدريب الذكاء الاصطناعي
استكشف الجدل المحيط بشركات التكنولوجيا العملاقة مثل آبل وإنفيديا وأنثروبيك باستخدام آلاف مقاطع الفيديو المسروقة من يوتيوب لتدريب نماذج الذكاء الاصطناعي الخاصة بهم دون إذن من منشئي المحتوى. اكتشف التداعيات على الصناعة والمعارك القانونية الجارية حول الاستخدام العادل وحقوق البيانات.
٢١ فبراير ٢٠٢٥

اكتشف كيف تستخدم شركات التقنية الكبرى مثل Apple و Nvidia و Anthropic محتوى من يوتيوبرز شعبيين مثل Mr. Beast و MKBHD و PewDiePie لتدريب نماذج الذكاء الاصطناعي الخاصة بهم دون إذن. يستكشف هذا المنشور المدونة التداعيات القانونية والأخلاقية لهذه الممارسة، مقدمًا رؤى حول المعركة المستمرة حول ملكية البيانات والاستخدام العادل في صناعة الذكاء الاصطناعي.
صعود تنقيب بيانات الذكاء الاصطناعي: كيف تستغل التقنية الكبرى محتوى مبدعي اليوتيوب
الآثار القانونية: الاستخدام العادل مقابل انتهاك حقوق الطبع والنشر
التأثير على مبدعي المحتوى: فقدان السيطرة والتعويض
المشهد المتطور: الدعاوى القضائية والشراكات والسباق للبيانات
الخاتمة
صعود تنقيب بيانات الذكاء الاصطناعي: كيف تستغل التقنية الكبرى محتوى مبدعي اليوتيوب
صعود تنقيب بيانات الذكاء الاصطناعي: كيف تستغل التقنية الكبرى محتوى مبدعي اليوتيوب
تكشف المقالة عن اتجاه مقلق حيث تستخدم شركات تقنية كبرى، بما في ذلك آبل وإنفيديا وأنثروبيك، آلاف مقاطع الفيديو على يوتيوب لتدريب نماذج الذكاء الاصطناعي الخاصة بهم دون إذن من منشئي المحتوى. أثار هذا الممارسة استياء بين يوتيوبرز شهيرين مثل Mr. Beast و MKBHD و PewDiePie وغيرهم.
ووجدت تحقيقات Proof News أن مجموعة البيانات المسماة "The Pile"، والتي تستخدمها شركات الذكاء الاصطناعي على نطاق واسع، تحتوي على ترجمات من أكثر من 173,000 مقطع فيديو على يوتيوب عبر أكثر من 48,000 قناة. ويشمل ذلك قنوات تعليمية مثل Khan Academy و MIT و Harvard، وكذلك قنوات ترفيهية شعبية مثل The Late Show with Stephen Colbert و Last Week with John Oliver و Jimmy Kimmel Live.
علق MKBHD، وهو يوتيوبر تقني بارز، على هذه المسألة، قائلاً إنه بينما قد لا تكون آبل مسؤولة مباشرة عن جمع البيانات، إلا أن هذه مشكلة متطورة ستظل تشكل تحديًا. كما أشار إلى أنه يدفع لخدمة لتوفير ترجمات أكثر دقة لمقاطع فيديوه، والتي يتم سرقتها بعد ذلك.
تناقش المقالة أيضًا التداعيات القانونية لهذه الممارسة، مقارنة ذلك بالدعوى القضائية الجارية بين صحيفة نيويورك تايمز وOpenAI، حيث اتهمت الصحيفة شركة الذكاء الاصطناعي بنسخ أجزاء كبيرة من مقالاتها. كما تذكر المقالة أن شركات ذكاء اصطناعي أخرى، مثل Midjourney، قد اتُهمت باستخدام مواد محمية بحقوق الطبع والنشر لتدريب نماذجها.
تتناول المقالة حجة الاستخدام العادل، حيث تدعي شركات الذكاء الاصطناعي أن أفعالهم مماثلة لقراءة وتعلم محتوى متاح للجمهور. ومع ذلك، تعترف المقالة بمخاوف منشئي المحتوى، الذين يشعرون أن جهودهم الشاقة يتم استغلالها دون موافقتهم.
تطرح المقالة أيضًا مشكلة مقاطع الفيديو المحذوفة على يوتيوب، والتي لا تزال تُدرج في نماذج الذكاء الاصطناعي، على الرغم من أن المنشئين قد لا يريدون بعد الآن أن يكون عملهم متاحًا. وهذا يسلط الضوء على التحديات القانونية والأخلاقية المعقدة المرتبطة باستخدام المحتوى المولد من المستخدم في تدريب الذكاء الاصطناعي.
بشكل عام، توفر المقالة نظرة شاملة على المشكلة المتنامية لجمع بيانات الذكاء الاصطناعي والتوترات التي أثارتها بين الشركات التقنية الكبرى ومنشئي المحتوى.
التعليمات
التعليمات