قاعدة بيانات ضخمة للموسيقى المستخدمة في تدريب الذكاء الاصطناعي
قاعدة بيانات ضخمة للموسيقى المستخدمة في تدريب الذكاء الاصطناعي
في خطوة تهدف إلى زيادة الشفافية حول البيانات المستخدمة في تدريب نماذج الذكاء الاصطناعي، كشف الصحفي أليكس رايزنر من صحيفة ذا أتلانتيك عن أربع مجموعات بيانات موسيقية ضخمة تستخدم في تدريب هذه النماذج، وجعلها قابلة للبحث بشكل كامل للجمهور.
تفاصيل المجموعات الموسيقية
تتضمن المجموعتان الأكبر 12 مليون و9 ملايين مقطوعة موسيقية على التوالي، بينما تحتوي المجموعتان الأصغر على أكثر من 100 ألف أغنية لكل منهما. وقد تم تحميل هذه المجموعات آلاف المرات، ومن الصعب تحديد الجهات التي استخدمتها بدقة، لكن شركتي جوجل وستابيليتي إيه آي أكدتا استخدامها في أوراق بحثية.
تساؤلات حول حقوق النشر
بعض المصادر، مثل مجموعة Free Music Archive، متاحة للبث الشخصي مجاناً ولكن إعادة استخدامها في تدريب الذكاء الاصطناعي قد يثير إشكاليات قانونية. تأتي هذه المبادرة في وقت تتصاعد فيه الدعاوى القضائية من فنانين وشركات إنتاج ضد شركات الذكاء الاصطناعي لاستخدام أعمالهم دون إذن.
أهمية الشفافية
تساعد قاعدة البيانات الجديدة الباحثين والصحفيين والجمهور على فهم نطاق البيانات المستخدمة في تطوير أنظمة الذكاء الاصطناعي، وتسلط الضوء على الحاجة إلى تنظيم أكثر وضوحاً لحقوق الملكية الفكرية في عصر الذكاء الاصطناعي.
زيروتايب لتصميم التطبيقات

