<aside> ℹ️ מידע על העמוד
המשימה היא בהנתן טקסט/ים ארוכ/ים, להפיק גרסה מקוצרת שמכילה את המידע המשמעותי (salient) מתוך הטקסט המקורי. זה יכול להיות extractive (לסמן חלקים spans רלוונטיים בתוך הטקסט) או abstractive (לייצר טקסט חדש שמסכם את הטקסט המקורי במילים חדשות). עוד משימות בתחום הן multi-document summarization ו-query-focused summarization, וגם interactive summarization.
בנצ’מארק מפורסם ל-extractive summarization הוא CNN/daily mail שמכיל 287k כתבות חדשותיות.
סיכום מפורט של סקירת ספרות מסוף 2022 על MDS שכולל הגדרת הבעיה, ארכיטקטורות שונות שנבחנו עבור הפתרון שלה (כולל יתרונות וחסרונות), מטריקות אווליואציה ודאטאסטים קיימים:
Multi-document Summarization via Deep Learning Techniques: A Survey