Abstract
Interest in Opinion Mining has been growing steadily in the last years, mainly because of its great number of applications and the scientific challenge it poses. Accordingly, the resources and techniques to help tackle the problem are many, and most of the latest work fuses them at some stage of the process. However, this combination is usually executed without following any defined guidelines and overlooking the possibility of replicating and improving it, hence the need for a deeper understanding of the fusion process becomes apparent. Information Fusion is the field charged with researching efficient methods for transforming information from different sources into a single coherent representation, and therefore can be used to guide fusion processes in Opinion Mining. In this paper we present a survey on Information Fusion applied to Opinion Mining. We first define Opinion Mining and describe its most fundamental aspects, later explain Information Fusion and finally review several Opinion Mining studies that rely at some point on the fusion of information
چکیده
در سال های اخیر، دیدگاه کاوی به طور پیوسته ای رشد کرده است، عمدتاً به این دلیل که دیدگاه کاوی دارای چالش های علمی و کاربردی بسیاری است. بر این اساس، منابع و روش هایی که باید برای مقابله با این روش به کار روند بسیار هستند و بسیاری از آثار، آنها را در مراحل فرآیند همجوشانی می کنند. با این حال، این ترکیب معمولاً بدون هیچ گونه راهنمایی وبررسی امکان تکرار و توسعه ی آن اجرا می شود و بنابراین نیاز است که درک عمیق تری از فرآیند همجوشانی پیدا کنیم. همجوشانی اطلاعات زمینه ای است که به تحقیق و پژوهش در مورد روش های کارا می پردازد و اطلاعات را از منابع مختلف به یک واحد منسجم انتقال می دهد و بنابراین می توان برای راهنمایی فرآیندهای همجوشانی در دیدگاه کاوی از آنها استفاده کرد. در این مقاله، ما نظرسنجی در مورد همجوشانی اطلاعات مرتبط با دیدگاه کاوی ارائه می دهیم. ما در ابتدا دیدگاه کاوی را تعریف می کنیم و اساسی ترین جنبه های آن را توصیف می کنیم سپس همجوشانی اطلاعات را توضیح می دهیم و در نهایت چندین مطالعه ی اخیر در مورد دیدگاه کاوی را در نقطه ی همجوشانی اطلاعات مورد بحث قرار می دهیم.
1-مقدمه
با ظهور وب 2.0 و رشد مستمر آن، میزان داده های آزادانه در دسترس تولید شده توسط کاربر به حجم بی سابقه ای رسیده است. با در دست داشتن میزان عظیمی از این داده ها، برای انسان غیرممکن است که در زمان منطقی و معقولی بتواند کل آن را سنجش کند و به همین دلیل است که در جوامع علمی علاقه مندان بسیاری وجود دارد که سیستم هایی ایجاد کنند که این سیستم ها قادر به استخراج اطلاعات از آن باشند. علاوه بر این، تنوع اطلاعات از نظر محتوایی، فرمت و فایل بسیار زیاد است...