يتيح التلخيص التكراري تمكين الذاكرة الحوارية طويلة المدى في LLMs

يتيح التلخيص التكراري تمكين الذاكرة الحوارية طويلة المدى في LLMs

تخيل أنك تتحدث مع شخص نسي ما قلته له قبل عشر دقائق. هذا هو بالضبط التحدي الذي تواجهه النماذج اللغوية المحدودة في المحادثات المطولة. على الرغم من وجود نوافذ كبيرة للسياق، غالباً ما تفشل هذه النماذج في استرجاع المعلومات الأساسية من وقت سابق في المحادثة، مما يؤدي إلى ردود غير متسقة ومتناقضة.

هذا القيد مهم للغاية بالنسبة لتطبيقات مثل رفقاء الذكاء الاصطناعي الشخصيين الذين يحتاجون إلى بناء علاقة من خلال تذكر تفضيلاتك، أو مساعدي الرعاية الصحية الذين يجب أن يتذكروا تاريخك الطبي لتقديم إرشادات دقيقة.

حل الذاكرة: التلخيص التكراري

في ورقة بحثية حديثة، طوّر الباحثون حلاً بسيطاً وقوياً لهذه المشكلة: تعليم النماذج اللغوية إنشاء ذاكرتها الخاصة وتحديثها باستمرار.

ويعمل هذا النهج، الذي يسمى التلخيص التكراري، من خلال:

  1. أولاً جعل النموذج اللغوي اللغوي اللغوي ينشئ ملخصاً موجزاً لحوار قصير

  2. ثم تحديث هذه الذاكرة بشكل متكرر من خلال الجمع بين الملخص السابق وسياق المحادثة الجديد

  3. وأخيراً استخدام هذه الذاكرة التي يتم تحديثها باستمرار لتوليد استجابات متسقة

The schematic overview of recursive summarization. The model uses the first session to generate initial memory (green arrows), then updates the memory when the second session ends (yellow arrows), and generates a response using the latest memory at the third session (blue arrows).
"نظرة عامة تخطيطية للتلخيص التكراري. يستخدم النموذج الجلسة الأولى لتوليد الذاكرة الأولية (الأسهم الخضراء)، ثم يقوم بتحديث الذاكرة عند انتهاء الجلسة الثانية (الأسهم الصفراء)، ثم يولد استجابة باستخدام أحدث ذاكرة في الجلسة الثالثة (الأسهم الزرقاء)." صور من الورقة البحثية.

يتناقض هذا النهج مع الطرق الحالية التي إما:

  • تخزين سجل الحوار بأكمله والاعتماد على النموذج لتحليله كله (نهج السياق فقط)

  • استخدام أنظمة الاسترجاع للعثور على الأقوال السابقة ذات الصلة (النهج القائم على الاسترجاع)

  • إنشاء ملخصات ثابتة لا تتطور مع المعلومات الجديدة (النهج التقليدي القائم على الذاكرة)

يكمن الابتكار الرئيسي في أن الذاكرة تتطور باستمرار، وتتضمن معلومات جديدة مع الحفاظ على صورة متماسكة لتاريخ المحادثة.

كيف يعمل توليد الذاكرة التكرارية

تكرار الذاكرة: بناء ملخصات الحوار وتحديثها

يقوم نهج الذاكرة التكرارية بإنشاء ملخص متماسك للمحادثات السابقة يتم تحديثه بعد كل جلسة حوار. وعلى عكس الطرق السابقة التي تستخدم "العمليات الصعبة" مثل الإلحاق أو الحذف، والتي تجزئ الملخص، فإن هذا النهج يعيد إنشاء الذاكرة بأكملها بشكل كلي.

قراءة المزيد

شارك هذا المقال