تعزيز تجربة الأعضاء من خلال التعاون الاستراتيجي
Ozzie Sutherland ، Iroro Orife ، Chih-Wei Wu ، Bhanu Srikanth
في Netflix ، فإن تقديم أفضل تجربة ممكنة لأعضائنا هو في قلب كل ما نقوم به ، ونحن نعلم أننا لا نستطيع القيام بذلك وحدنا. لهذا السبب نعمل عن كثب مع نظام بيئي متنوع لشركاء التكنولوجيا ، يجمعون بين خبرتهم العميقة مع رؤيتنا الإبداعية والتشغيلية. معًا ، نستكشف أفكارًا جديدة ، ونطور الأدوات العملية ، ودفع الحدود الفنية في خدمة سرد القصص. هذا التعاون لا يمكّن التصميمات الموهوبة في عروضنا فقط من خلال أدوات أفضل لإعطاء رؤيتهم إلى الحياة ، ولكنها تساعدنا أيضًا على الابتكار في خدمة أعضائنا. من خلال بناء هذه الشراكات حول الثقة والشفافية والغرض المشترك ، نحن قادرون على التحرك بشكل أسرع وأكثر هدوءًا ، دائمًا بهدف جعل قصصنا أكثر غامرة ، يمكن الوصول إليها ، وممتعة للجماهير في كل مكان. أحد المجالات التي يكون فيها هذا التعاون إحداث تأثير ذي معنى هو تحسين وضوح الحوار ، من مجموعة إلى شاشة. نسمي هذا خط أنابيب سلامة الحوار.
خط أنابيب سلامة الحوار
لقد كنا جميعًا هناك ، حيث استقرنا في ليلة من الترفيه ، فقط لنجد أنفسنا متوجهة للقبض على ما قيل للتو على الشاشة. لقد انتهيت في القصة ، استثمرت تمامًا ، عندما يختفي خط حوار رئيسي فجأة في الهواء. “انتظر ، ماذا قالوا؟ لا أستطيع أن أفهم الحوار! ماذا حدث للتو؟”
يمكنك التقاط جهاز التحكم عن بُعد وإعادة الترجيع ، أو رفع مستوى الصوت ، أو محاولة البقاء معه وآمل ألا يحدث هذا مرة أخرى. يتطلب إنشاء سلسلة وأفلام متطورة وحديثة جهدًا فنيًا وتقنيًا لا يصدق. في Netflix ، نسعى جاهدين لضمان سهلة على الجمهور. يمكن أن تنهار وضوح الحوار في نقاط متعددة فيما نسميه خط أنابيب سلامة الحوار، الرحلة من التقاط المحدد إلى التشغيل النهائي في المنزل. يمكن أن تسهم العديد من جوانب العملية في الحوار الذي يصعب فهمه:
- أنماط التمثيل الطبيعية وأنماط الكلام المتنوعة واللكنات
- المواقع الصاخبة ، مشاكل وضع الميكروفون في المجموعة
- أنماط خلط سينمائية (نطاق ديناميكي عالي) ، معالجة الحوار المفرطة ، المعدات المتدنية
- تسوية الصوت من خلال خط أنابيب التوزيع
- أجهزة تلفزيون مع مكبرات صوت غير كافية ، بيئات المنزل صاخبة
يعد معالجة هذه القضايا أمرًا بالغ الأهمية للحفاظ على مستوى التميز الذي يستحقه محتوىنا.
القياس على النطاق
يستخدم Netflix عدادات الصوت المعيارية للصناعة لقياس المحتوى والتزامه بمواصفاتنا الصاخبة الأساسية. توفر هذه الأداة أيضًا ملاحظات حول النطاق الديناميكي الصوتي (بصوت عالٍ إلى ناعم) مما يؤثر على وضوح الحوار. أراد فريق خوارزميات الصوت في Netflix أخذ هذه القياسات بشكل أكبر وتطوير فهم كلي لوضوح الحوار طوال فترة تشغيل عنوان معين.
طور الفريق نظام قياس وضوح الكلام يعتمد على مقياس الوضوح الهدف قصير (STOI) [Taal et al. (IEEE Transactions on Audio, Speech, and Language Processing)]. أولاً ، يحلل كاشف نشاط الكلام حوار STEM لتقديم كلمات الكلام ، والتي تتم مقارنتها بعد ذلك بأصوات غير الكلام في المزيج ، وعادة ما تكون الموسيقى والتأثيرات. ثم يقوم النظام بحساب نسبة الإشارة إلى الضوضاء ، في كل نطاق تردد للكلام ، والتي يتم تلخيص نتائجها بإيجاز ، لكل قلة على النطاق [0, 1.0]، لقياس الدرجة التي يمكن أن يصرف فيها الموسيقى المتنافسة والآثار المستمع.
تحسين الحوار قبل التسليم
يعد فهم وضوح الحوار عبر عناوين Netflix لا يقدر بثمن ، لكن مهمتنا تتجاوز التحليل – نحن نسعى جاهدين لتمكين المبدعين من الأدوات اللازمة لخلاصات الصراع التي لها صدى بسلاسة مع الجماهير في المنزل.
عند رؤية الافتقار إلى الإضافات المخصصة لمقاييس حوار الحوار لمحطات العمل الصوتية الرقمية ، تعاوننا مع قادة الصناعة ، معهد Fraunhofer لتكنولوجيا الوسائط الرقمية IDMT (Fraunhofer IDMT) و Nugen Audio إلى Pioneer حلاً يعزز التحكم الإبداعي ويضمن حوارًا عن الجليد من التوصيل النهائي.
لقد تعاوننا مع Fraunhofer IDMT لتكييف حل وضوح الكلام المستند إلى تعلم الآلات لمعايير المكون الإضافي عبر المنصات وجلبت في Nugen Audio لتطوير المكونات الإضافية المتوافقة مع DAW.
Fraunhofer idmt
قامت وزارة السمع والكلام والتكنولوجيا الصوتية في Fraunhofer بإجراء بحث وتطوير كبير في أدوات معالجة الوسائط التي تقيس وضوح الكلام. في عام 2020 ، تم دمج الطريقة القائمة على التعلم الآلي في محطة عمل الصوت الرقمية في شتاينبرغ. لقد تعاملنا مع فريق Fraunhofer Engineering مع اقتراح تعاون لجعل تقنيته في متناول محطات العمل الصوتي الأخرى من خلال معايير المكون الإضافي عبر المنصات (Virtual Studio) ومعايير AAX (AAX Audio Extension). كان العلماء حريصين على المشروع وقدموا مكتبة وضوح الحوار.
Nugen Audio
أنشأت Nugen Audio المكون الإضافي VESLM لتزويد فرق الصوت بطريقة فعالة ودقيقة لقياس الخلطات للمطابقة لمواصفات البث والبث التقليدي – بصوت عالٍ ، صوت الحوار ، وذروة حقيقية. منذ ذلك الحين ، أصبحت VISLM أداة تستخدم على نطاق واسع خلال صناعة ما بعد الإنتاج العالمية. عقدت Nugen Audio شراكة مع Fraunhofer ، ودمج مكتبات وضوح الحوار Fraunhofer IDMT في أداة جديدة للصناعة-Dialogcheck Nugen. هذه الأداة تعطي إعادة تسجيل الخلاطات رؤى في الوقت الفعلي ، ومساعدتهم على ضبط وضوح الحوار في أهم النقاط في عملية الخلط ، مما يضمن أن كل كلمة واضحة ومفهومة.
حوار أوضح من خلال التعاون
إن صياغة الحوار الكريستالي غير المتواصل ليس مجرد تحد فني-إنه فن يتطلب ابتكارًا مستمرًا وتعاونًا قويًا في الصناعة. لتمكين المبدعين ، يقوم Netflix وشركائها بتضمين أدوات قياس الوضوح المتقدمة مباشرة في DAWS ، مما يمنح فرق الصوت القدرة على:
- اكتشف وحل قضايا وضوح الحوار في وقت مبكر من هذا المزيج.
- وضوح الكلام الدقيق دون المساس بالقصد الفني.
- تقديم القصص الغامرة التي يمكن الوصول إليها إلى كل مشاهد ، في أي بيئة استماع.
في Netflix ، نحن ملتزمون بدفع حدود التميز الصوتي. من الرائدة في طريقة Estoi (الوضوح الموسع على المدى القصير) إلى التعاون مع Fraunhofer و Nugen Audio على أدوات متطورة مثل المكون الإضافي DialogCheck ، فإننا نضع معيارًا جديدًا لوضوح الحوار-ضمان سماع كل كلمة كما هو مخصص للمبدعين. لكن الابتكار لا يحدث في عزلة. من خلال العمل مع شركائنا ، يمكننا الاستمرار في دفع حدود ما هو ممكن ، وتغذي الإبداع وقيادة مستقبل رواية القصص.
أخيرًا ، نود أن نقوم بتوسيع نطاق شكر لسكوت كرامر على مساهماته في هذه المبادرة.
اكتشاف المزيد من هيدب فيديو
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.