Abstract
In this paper we propose a novel technique for summarizing a text based on the linguistics properties of text elements and semantic chains among them. In most summarization approaches, the major consideration is the statistical properties of text elements such as term frequency. Here we use centering theory which helps us to recognize semantic chains in a text, for proposing a new automatic single document summarization approach. For processing a text by centering theory and extracting a coherent summery, a processing pipeline should be constructed. This pipeline consists of several components such as co-reference resolution, semantic role labeling and POS [Part of speech] tagging
چکیده
در اين مقاله يك تكنيك جديد براي خلاصه كردن يك متن با توجه به ويژگي هاي زباني عناصر موجود در متن و زنجيره هاي معناي ميان آنها ارائهشده است. در بسياري از روش هاي موجود خلاصه سازي متون، تمامي توجه به ويژگي هاي آماري عناصر متن است. در اينجا با استفاده از نظريه مركزيت كه زنجيره هاي انسجام در داخل متن را تشخيص ميدهد، يك روش جديد خلاصه سازي خودكار متن ارائه ميشود. براي پردازش متن توسط نظريه مركزيت و استخراج يك خلاصه ي منسجم احتياج به در هم آميختن تعدادي از ابزارهاي پردازش متن شامل روش جايگزيني ضماير و گروه هاي اسمي با مرجع اسمي آنها (Semantic Role Labeling)، روش برچسب زني نقش گرامري اسامي در داخل يك جمله (Co-reference Resolution) و روش برچس بزني گروه هاي اسمي (POS Tagger) است.