Abstract
Twitter as a new form of social media can potentially contain much useful information, but content analysis on Twitter has not been well studied. In particular, it is not clear whether as an information source Twitter can be simply regarded as a faster news feed that covers mostly the same information as traditional news media. In This paper we empirically compare the content of Twitter with a traditional news medium, New York Times, using unsupervised topic modeling. We use a Twitter-LDA model to discover topics from a representative sample of the entire Twitter. We then use text mining techniques to compare these Twitter topics with topics from New York Times, taking into consideration topic categories and types. We also study the relation between the proportions of opinionated tweets and retweets and topic categories and types. Our comparisons show interesting and useful findings for downstream IR or DM applications
چکیده
توییتر به عنوان فرم جدیدی از رسانه های اجتماعی می تواند به صورت بالقوه شامل اطلاعات سودمندی باشد، اما تحلیل محتوا در توییتر به خوبی مطالعه نشده است. به ویژه، واضح نیست که به عنوان یک منبع اطلاعات توییتر می تواند به عنوان سایت خبری سریعتر که اغلب اطلاعات مشابه با رسانه خبری سنتی را پوشش می دهد، در نظر گرفته شود یا نه. در این مقاله به صورت تجربی محتوای توییتر را با یک رسانه خبری سنتی، به نام نیویورک تایمز، با استفاده از مدلسازی موضوعی نظارت نشده مقایسه می کنیم. از یک مدل Twitter-LDA برای کشف موضوعاتی از یک نمونه به نمایندگی از کل توییتر استفاده می کنیم. سپس از تکنیک متن کاوی برای مقایسه موضوعات توییتر با موضوعاتی از نیویورک تایمز استفاده می کنیم، انواع موضوع ها و گروه بندی های موضوعی را در نظر می گیریم. همچنین رابطه بین توییت ها و ریتوییت ها دسته های موضوعی و انواع موضوعات را مطالعه می کنیم. مقایسه ما یافته های جالب و سودمندی را برای برنامه های کاربردی IR یا DM پایین دست ارائه می دهد.
1-مقدمه
در طی چند سال گذشته، توییتر، که یک سرویس میکروبلاگینگ است، به یک پلت فرم بسیار مشهور برای کاربران وب تبدیل شد که از طریق آن می توانستند با یکدیگر ارتباط برقرار کنند. به دلیل اینکه توییت ها جمع و جور سریع بودند توییتر به صورت گسترده گسترش یافت، و از طریق آن افراد آخرین اخبار را به اشتراک می گذاشتند، ایده های خود را به روز رسانی می کردند. محبوبیت این فرم جدید از رسانه اجتماعی شروع به، جذب توجه محققین کرد...