Abstract
This technical report provides a tutorial on the theoretical details of probabilistic topic modeling and gives practical steps on implement-ing topic models such as Latent Dirichlet Allocation (LDA) through the Markov Chain Monte Carlo approximate inference algorithm Gibbs Sam-pling
چکیده
در این گزارش فنی به ارائهی جزئیات تئوریکِ مدلسازی موضوعی احتمالاتی میپردازیم و گامهای عملی مورد نیاز برای پیادهسازی مدلهای موضوعی همچون تخصیص پنهان دیریکله (LDA) را به وسیله ی تکنیک نمونهگیری گیبس در الگوریتم استنتاج تقریبیِ زنجیره مارکوف با مونتکارلو ارائه میدهیم.
1-مقدمه
مدل تخصیص پنهان دیریکله (LDA) که برای اولین بار در سال 2003 میلادی توسط آقای بدلی و همکارانش معرفی گردید، باعث شد تا مدلسازی موضوعی - به عنوان یکی از زیر شاخصه های علم یادگیری ماشین، که در علومی نظیر زبانشناسی رایانشی [4]، انفورماتیک پزشکی [8] و علوم سیاسی [2] کاربرد دارد - به یکی از مطرحترین و موفقترین پارادایمها برای یادگیری نظارت شده و یادگیری نظارت نشده مبدل گردد...