چکیده
در طول سال های گذشته، با پیشرفت فناوری حجم داده های تولید شده طی فرآیندهای شبیه سازی و پردازشی به طور پیوسته در حال رشد بوده است. در چند سال اخیر، موضوع بسیاری از پژوه ها درباره ی روش های خلاصه سازی این داده ها بوده است. خلاصه سازی متن یکی از موضوعات تحقیقاتی است که هدف آن معطوف بر نمایش یک متن به صورت کوتاه شده است. محققان در تلاش بوده اند تا سیستمی ایجاد کنند که بتواند خلاصه های مفیدی از تمام ایده های موجود در یک متن را نمایش دهد. به طور کلی روشهای خلاصه سازی متن را میتوان به دسته استخراجی و انتزاعی تبدیل کرد. در این مقاله تمام سیستم های مطرح شده برای انجام این کار با یکدیگر مقایسه شده و معایب هر کدام و همچنین فناوری های استفاده شده در هر سیستم مورد بررسی قرار گرفته اند. در این مقاله همچنین مجموعه داده های استاندارد جدیدی که برای توسعه سیستم های خلاصه سازی بکار گرفته شده اند نیز مورد بررسی قرار گرفته اند. علاوه بر این موارد، پارامترهای تست و روشهای استفاده شده برای تست کارایی سیستمهای خلاصه سازی تحلیل شده اند.
۱-مقدمه
در سالهای اخیر، اطلاعات به عنوان منبع مهمی شناخته شده است که میتواند کاربردهای مختلفی داشته باشد. اگر تمام اطلاعات تولید شده در روز جمع آوری شوند، به حجم زیادی از اطلاعات دسترسی خواهیم داشت...