تقنية جديدة من DeepMind تُضفي موسيقى وحوار على مقاطع الفيديو!

كشفت DeepMind، المختبر الذكي التابع لجوجل، عن تقنية جديدة تُمكن من إضافة الموسيقى، بل والحوار، إلى مقاطع الفيديو!

يُطلق على هذه التقنية الرائدة اسم “V2A” أو (Video-to-Audio)، وهي مصممة للعمل مع أدوات إنشاء الفيديو مثل Google Veo و OpenAI Sora.

ووفقًا لشرح فريق DeepMind على مدونة الشركة، فإن النظام قادر على تحليل البكسل وفهم محتوى الفيديو، ثم دمج هذه المعلومات مع نصوص مُحددة لتكوين المؤثرات الصوتية المُناسبة لما يحدث على الشاشة.

وليس ذلك فحسب، بل يمكن استخدام هذه الأداة أيضًا لإنشاء موسيقى تصويرية لمقاطع الفيديو التقليدية، مثل الأفلام الصامتة وأي فيديو آخر لا يحتوي على صوت.

اعتمد باحثو DeepMind في تدريب هذه التقنية على كميات هائلة من البيانات، شملت مقاطع فيديو وصوتيات وحتى تعليقات مُولدة بالذكاء الاصطناعي تحتوي على أوصاف مُفصّلة للأصوات ونصوص الحوار.

وهدفهم من ذلك كان تعليم النظام كيفية ربط الأصوات المُحددة بالمَشاهد البصرية.

وبحسب موقع تك كرانش، فإن DeepMind ليست أول من يُصدر أداة ذكاء اصطناعي لإنشاء المؤثرات الصوتية، فقد سبقها ElevenLabs في إصدار أداة مشابهة، لكن تقنية V2A تتميز بفهمها للبكسل الخام، مما يجعلها أكثر دقة وواقعية.

يُمكن استخدام نصوص مُحددة مع تقنية V2A لتوجيه النتائج وتشكيلها بما يتناسب مع رغبة المستخدم.

منذ أسبوعينآخر تحديث: 19 يونيو، 2024

اظهر المزيد

إتبعنا

عاجل.. 4 لاعبين مهددين بالغياب عن الزمالك في مباراة الأهلي بقمة الدوري

جدول مباريات برشلونة في الليجا موسم 2024-2025 والقنوات الناقلة

مقالات ذات صلة

كوالكوم تعلن رسميًا منصة Snapdragon X Plus

صندوق خليفة لتطوير المشاريع و”إي آند الإمارات” يتعاونان لتسريع نمو الشركات الناشئة

يلا فور تريند يستعرض عروض رنين 17 إبريل 2024

ون بلس تكشف عن إصدار eSIM من ساعتها الذكية

اترك تعليقاً إلغاء الرد