اخبار منصات الأفلام

FM-intent: التنبؤ بجلسة المستخدم نية مع التعلم المتعدد المهام هرمية | بواسطة Netflix Technology Blog | مايو ، 2025


المؤلفون: سيجون أوه ، موميتا بهاتشاريا ، ييو إينغ ، سودارشان لامخيد ، كو جين هسياو ، وجوستين باسيليكو

أصبحت أنظمة التوصية مكونات أساسية للخدمات الرقمية عبر التجارة الإلكترونية ووسائط البث والشبكات الاجتماعية [1, 2]. في Netflix ، تدفع هذه الأنظمة تأثير المنتج والأعمال الهام من خلال توصيل الأعضاء بالمحتوى ذي الصلة في الوقت المناسب [3, 4]. بينما توصيتنا نموذج الأساس (FM) حقق تقدمًا كبيرًا في فهم تفضيلات المستخدم من خلال التعلم على نطاق واسع من تاريخ التفاعل (يرجى الرجوع إلى هذا شرط حول FM @ Netflix) ، هناك فرصة لزيادة تعزيز قدراتها. من خلال توسيع FM لدمج التنبؤ بنقص المستخدم الأساسية ، فإننا نهدف إلى إثراء فهم جلسات المستخدم إلى ما وراء التنبؤ من العناصر التالية ، وبالتالي تقديم تجربة توصية أكثر شمولاً ودقيقة.

أبرزت الأبحاث الحديثة أهمية فهم نية المستخدم في المنصات عبر الإنترنت [5, 6, 7, 8]. كما شيا وآخرون. [8] يظهر في Pinterest ، أن التنبؤ بقصد مستقبلي للمستخدم يمكن أن يؤدي إلى توصيات أكثر دقة وشخصية. ومع ذلك ، عادةً ما تستخدم أساليب التنبؤ النية الحالية تعلمًا بسيطًا متعدد المهام يضيف رؤوس التنبؤ النية إلى نماذج التنبؤ من العنصر التالي دون إنشاء علاقة هرمية بين هذه المهام.

لمعالجة هذه القيود ، نقدم fm-intent، نموذج توصية جديد يعزز نموذج الأساس لدينا من خلال التعلم المتعدد المهام التسلسل الهرمي. يلتقط FM-intent نية الجلسة الكامنة للمستخدم باستخدام كل من الإشارات الضمنية قصيرة الأجل وطويلة الأجل كوكيل ، ثم تستفيد من هذا التنبؤ النية لتحسين توصيات العنصر التالي. على عكس الأساليب التقليدية ، تحدد FM-intent تسلسلًا هرميًا واضحًا حيث تقوم التنبؤات النية بإبلاغ توصيات العناصر مباشرة ، مما يخلق خط أنابيب توصية أكثر تماسكًا وفعالية.

يقدم FM-intent ثلاثة مساهمات أساسية:

  1. نموذج توصية جديد يلتقط نية المستخدم على منصة Netflix ويعزز التنبؤ من العناصر التالية باستخدام معلومات النية هذه.
  2. نهج التعلم متعدد المهام هرمي يضعف بشكل فعال كل من مصالح المستخدمين على المدى القصير والطويل الأجل.
  3. التحقق التجريبي الشامل يظهر تحسينات كبيرة في الأداء على النماذج الحديثة ، بما في ذلك نموذج الأساس لدينا.

في النظام الإيكولوجي لـ Netflix ، تتجلى نية المستخدم من خلال بيانات تعريف التفاعل المختلفة ، كما هو موضح في الشكل 1.

الشكل 1: نظرة عامة على بيانات مشاركة المستخدم في Netflix. يمكن أن ترتبط نية المستخدم بعدة بيانات بيانات التفاعل. نحن نستفيد من الإشارات الضمنية المختلفة للتنبؤ بنوايا المستخدم والبند التالي.

في Netflix ، يمكن أن يكون هناك أنواع متعددة من نوايا المستخدم. على سبيل المثال،

نوع العمل: الفئات التي تعكس ما يعتزم المستخدمون القيام به على Netflix ، مثل اكتشاف محتوى جديد مقابل محتوى مستمر سابقًا. على سبيل المثال ، عندما يلعب أحد الأعضاء حلقة متابعة لشيء كانوا يشاهدونه بالفعل ، يمكن تصنيف ذلك على أنه “متابعة المشاهدة”.

تفضيل النوع: ملصقات النوع المحددة مسبقًا (على سبيل المثال ، الإجراء ، الإثارة ، الكوميديا) التي تشير إلى تفضيلات محتوى المستخدم أثناء الجلسة. يمكن أن تتحول هذه التفضيلات بشكل كبير بين الجلسات ، حتى بالنسبة لنفس المستخدم.

نوع الفيلم/العرض: ما إذا كان المستخدم يبحث عن فيلم (عادةً تجربة عرض واحدة أو أطول) أو برنامج تلفزيوني (يحتمل أن يكون هناك حلقات متعددة من المدة الأقصر).

الوقت بعد الإفراج: ما إذا كان المستخدم يفضل المحتوى الذي تم إصداره حديثًا ، أو المحتوى الحديث (على سبيل المثال ، بين أسبوع وشهر) ، أو عناوين الكتالوج Evergreen.

تعمل هذه الأبعاد كوكلاء لنوايا المستخدم الكامنة ، والتي لا يمكن ملاحظتها بشكل مباشر ولكنها حاسمة لتقديم التوصيات ذات الصلة.

توظف FM-Intent نهجًا تعليميًا متعدد المهام هرمي مع ثلاثة مكونات رئيسية ، كما هو موضح في الشكل 2.

الشكل 2: رسم توضيحي معماري لنموذج التعلم المتعدد المهام في التسلسل الهرمي FM-intent لنوايا المستخدم وتوقعات العناصر. نحن نستخدم ملصقات نية المعاقف الأرضية وملصقات معرف العناصر لتحسين التنبؤات.

1. تكوين تسلسل ميزة الإدخال

يقوم المكون الأول ببناء ميزات الإدخال الغنية من خلال الجمع بين بيانات التفاعل. تجمع ميزة الإدخال لكل تفاعل بين التضمينات الفئوية والميزات العددية ، مما يخلق تمثيلًا شاملاً لسلوك المستخدم.

2. تنبؤ نية المستخدم

يعالج مكون التنبؤ القصد تسلسل ميزة الإدخال من خلال تشفير المحولات ويولد تنبؤات لإشارات النوايا المتعددة.

يقوم تشفير المحول بفعالية بصياغة الاهتمام طويل الأجل للمستخدمين من خلال آليات الانتباه متعددة الرأس. لكل مهمة تنبؤ ، يتم تحويل الترميز القصد إلى درجات التنبؤ عبر طبقات متصلة بالكامل.

إن الابتكار الرئيسي في FM-intent هو التجميع القائم على الانتباه لتنبؤات النية الفردية. يولد هذا النهج تضمينًا شاملاً يلتقط الأهمية النسبية لإشارات النية المختلفة لكل مستخدم ، مما يوفر رؤى قيمة للتخصيص والتفسير.

3. التنبؤ بنظام واحد مع تعلم المهام المتعددة التسلسل الهرمي

يجمع المكون النهائي بين ميزات الإدخال وضمان نية المستخدم لتقديم توصيات أكثر دقة عن العنصر التالي.

توظف FM-intent تعلمًا متعدد المهام هرمي حيث يتم إجراء التنبؤات النية أولاً ، ويتم استخدام نتائجها كميزات إدخال لمهمة التنبؤ بنظام العناصر التالية. تضمن هذه العلاقة الهرمية أن يتم إعلام توصيات العنصر التالي من قبل نية المستخدم المتوقعة ، مما يخلق نموذج توصية أكثر تماسكًا وفعالية.

أجرينا تجارب شاملة غير متصلة بالإنترنت على بيانات مشاركة مستخدم Netflix التي تم أخذ عينات منها لتقييم أداء FM-intent. لاحظ أن FM-intent تستخدم مجموعة بيانات أصغر بكثير للتدريب مقارنة بنموذج إنتاج FM بسبب بنية التنبؤ الهرمية المعقدة.

دقة التنبؤ من الناحية التالية والتنبؤ المقبل

يقارن الجدول 1 FM-intent مع العديد من نماذج التوصية المتسلسلة الحديثة ، بما في ذلك نموذج الإنتاج لدينا (FM-intent-V0).

الجدول 1: نتائج التنبؤ من العنصر التالي والتنبؤ التالي من خطوط الأساس وطريقةنا المقترحة FM-intent على مجموعة بيانات مشاركة مستخدم Netflix.

يتم تمثيل جميع المقاييس كتحسينات نسبية ٪ مقارنة بخط الأساس SOTA: المعاملات. يشير N/A إلى أن النموذج غير قادر على التنبؤ بقصد معين. لاحظ أننا أضفنا طبقات إضافية متصلة بالكامل إلى خطوط الأساس LSTM و GRU و Transformer من أجل التنبؤ بنية المستخدم ، بينما استخدمنا التطبيقات الأصلية لخطوط الأساس الأخرى. يوضح FM-intent تحسنًا كبيرًا من الناحية الإحصائية بنسبة 7.4 ٪ في دقة التنبؤ من العناصر التالية مقارنة بأفضل خط الأساس (المعاملات).

تُظهر معظم النماذج الأساسية أداءً محدودًا لأنها إما لا يمكنها التنبؤ بنية المستخدم أو لا يمكنها دمج التنبؤات النية في توصيات العنصر التالي. يعمل نموذج الإنتاج الخاص بنا (FM-intent-V0) جيدًا ولكنه يفتقر إلى القدرة على التنبؤ والاستفادة من نية المستخدم. لاحظ أن FM-intent-V0 مدرب مع مجموعة بيانات أصغر لمقارنة عادلة مع النماذج الأخرى ؛ يتم تدريب نموذج الإنتاج الفعلي مع مجموعة بيانات أكبر بكثير.

الشكل 3: K-means ++ (k = 10) تجميع ضمانات نية المستخدم التي وجدها FM-intent ؛ يجد FM-intent مجموعات فريدة من المستخدمين التي تشترك في النية المماثلة.

تقوم FM-intent بإنشاء تضمينات مفيدة للمستخدم يمكن استخدامها لتجميع المستخدمين بنوايا مماثلة. يتصور الشكل 3 10 مجموعات متميزة تم تحديدها من خلال التجميع K-means ++. تكشف هذه المجموعات عن قطاعات مستخدم ذات معنى مع أنماط عرض مميزة:

  • المستخدمين الذين يكتشفون في المقام الأول محتوى جديدًا مقابل أولئك الذين يواصلون مشاهدة المحتوى الحديث/المفضل.
  • عشاق النوع (على سبيل المثال ، أنيمي/أطفال مشاهدين محتوى).
  • المستخدمين الذين لديهم أنماط عرض محددة (على سبيل المثال ، إعادة المشاهدة عكس المشاهدين غير الرسميين).

تم دمج FM-intent بنجاح في النظام الإيكولوجي لتوصية Netflix ، يمكن الاستفادة منه للعديد من تطبيقات المصب:

تحسين واجهة المستخدم الشخصية: يمكن أن تقوم نية المستخدم المتوقعة بإبلاغ تخطيط المحتوى واختيار المحتوى على الصفحة الرئيسية لـ Netflix ، مع التأكيد على صفوف مختلفة بناءً على ما إذا كان المستخدمون في وضع الاكتشاف أو وضع المشاهدة المتابعة أو استكشاف أنواع محددة.

التحليلات وفهم المستخدم: توفر التضمينات والمجموعات القضائية رؤى قيمة في عرض أنماط وتفضيلات المشاهدة ، وإبلاغ قرارات الاستحواذ على المحتوى وإنتاجها.

إشارات التوصية المحسنة: تنبؤات النية بمثابة ميزات لنماذج التوصية الأخرى ، وتحسين دقتها وأهميتها.

البحث التحسين: تساعد تنبؤات النية في الوقت الفعلي على إعطاء الأولوية لنتائج البحث بناءً على نية الجلسة الحالية للمستخدم.

يمثل FM-intent تقدمًا في إمكانات توصية Netflix من خلال تعزيزها من خلال التعلم المتعدد المهام للتنبؤ بالتنبؤ. تُظهر تجاربنا الشاملة أن FM-intent يتفوق بشكل كبير على النماذج الحديثة ، بما في ذلك نموذج الأساس السابق الذي يركز فقط على التنبؤ من العناصر التالية. من خلال فهم ليس فقط ما قد يشاهده المستخدمون بعد ذلك ، ولكن ما يوفره المستخدمون الأساسيون ، يمكننا تقديم توصيات أكثر تخصيصًا وذات صلة ومرضية.

نشكر زملائنا المذهلين في فريق الأساس والرسم. للحصول على ملاحظاتهم والمناقشات القيمة. كما نشكر فرق شريكنا على الحصول على هذا الأمر في الإنتاج.

[1] Amatriain ، X. ، & Basilico ، J. (2015). أنظمة التوصية في الصناعة: دراسة حالة Netflix. في كتيب أنظمة التوصية (ص. 385-419). سبرينغر.

[2] Gomez-uribe ، CA ، & Hunt ، N. (2015). نظام التوصية Netflix: الخوارزميات وقيمة العمل والابتكار. معاملات ACM على أنظمة معلومات الإدارة (TMIS) ، 6 (4) ، 1-19.

[3] Jannach ، D. ، & Jugovac ، M. (2019). قياس قيمة الأعمال لأنظمة التوصية. معاملات ACM على أنظمة معلومات الإدارة (TMIS) ، 10 (4) ، 1-23.

[4] Bhattacharya ، M. ، & Lamkhede ، S. (2022). زيادة البحث في Netflix مع توصيات مقتبسة داخل الجلسة. في وقائع مؤتمر ACM السادس عشر حول أنظمة التوصية (الصفحات 542-545).

[5] Chen ، Y. ، Liu ، Z. ، Li ، J. ، McauLey ، J. ، & Xiong ، C. (2022). التعلم المتناقض النية للتوصية المتسلسلة. في وقائع مؤتمر الويب ACM 2022 (ص. 2172-2182).

[6] Ding ، Y. ، Ma ، Y. ، Wong ، WK ، & Chua ، TS (2021). نمذجة نية المستخدم الفورية والانتقال على مستوى المحتوى لتوصية الموضة المتسلسلة. معاملات IEEE على الوسائط المتعددة ، 24 ، 2687-2700.

[7] Liu ، Z. ، Chen ، H. ، Sun ، F. ، Xie ، X. ، Gao ، J. ، Ding ، B. ، & Shen ، Y. (2021). تفضيل القصد لفصل عن تمثيل المستخدم على نظام التوصية عبر الإنترنت. في وقائع المؤتمر الدولي التاسع والعشرون حول المؤتمرات المشتركة الدولية حول الذكاء الاصطناعي (الصفحات 2575-2582).

[8] Xia ، X. ، Eksombatchai ، P. ، Pancha ، N. ، Badani ، DD ، Wang ، PW ، Gu ، N. ، Joshi ، SV ، Farahpour ، N. ، Zhang ، Z. ، & Zhai ، A. (2023). المعاملات: نموذج إجراء المستخدم الحقيقي القائم على المحولات للتوصية في Pinterest. في وقائع مؤتمر ACM SIGKDD 29 لاكتشاف المعرفة واستخراج البيانات (ص. 5249-5259).


اكتشاف المزيد من هيدب فيديو

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من هيدب فيديو

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading