<aside> ℹ️ מידע על העמוד

הגדרת המשימה

המשימה היא בהנתן טקסט/ים ארוכ/ים, להפיק גרסה מקוצרת שמכילה את המידע המשמעותי (salient) מתוך הטקסט המקורי. זה יכול להיות extractive (לסמן חלקים spans רלוונטיים בתוך הטקסט) או abstractive (לייצר טקסט חדש שמסכם את הטקסט המקורי במילים חדשות). עוד משימות בתחום הן multi-document summarization ו-query-focused summarization, וגם interactive summarization.

בנצ’מארקים

בנצ’מארק מפורסם ל-extractive summarization הוא CNN/daily mail שמכיל 287k כתבות חדשותיות.

Untitled

סיכום מסמכים מרובים Multi-doc summarization

סיכום מפורט של סקירת ספרות מסוף 2022 על MDS שכולל הגדרת הבעיה, ארכיטקטורות שונות שנבחנו עבור הפתרון שלה (כולל יתרונות וחסרונות), מטריקות אווליואציה ודאטאסטים קיימים:

Multi-document Summarization via Deep Learning Techniques: A Survey