Skip Navigation Linksلیست مقالات ترجمه شده / خرید و دانلود
968,000

پیش از اقدام به خرید ترجمه فارسی می توایند نسخه انگلیسی را به صورت رایگان دانلود و بررسی نمایید. متن چکیده و ترجمه آن در پایین همین صفحه قابل مشاهده است.
دانلود رایگان مقاله انگلیسی
موسسه ترجمه البرز اقدام به ترجمه مقاله " مهندسی فناوری اطلاعات " با موضوع " ادغام خوشه بندی سند و مدلسازی عنوان " نموده است که شما کاربر عزیز می توانید پس از دانلود رایگان مقاله انگلیسی و مطالعه ترجمه چکیده و بخشی از مقدمه مقاله، ترجمه کامل مقاله را خریداری نمایید.
عنوان ترجمه فارسی
ادغام خوشه بندی سند و مدلسازی عنوان
نویسنده/ناشر/نام مجله :
arXiv
سال انتشار
2013
کد محصول
1009124
تعداد صفحات انگليسی
10
تعداد صفحات فارسی
19
قیمت بر حسب ریال
968,000
نوع فایل های ضمیمه
Pdf+Word
حجم فایل
850 کیلو بایت
تصویر پیش فرض



Abstract

Document clustering and topic modeling are two closely related tasks which can mutually benefit each other. Topic modeling can project documents into a topic space which facilitates effective document clustering. Cluster labels discovered by document clustering can be incorporated into topic models to extract local topics specific to each cluster and global topics shared by all clusters. In this paper, we propose a multi-grain clustering topic model (MGCTM) which integrates document clustering and topic modeling into a unified framework and jointly performs the two tasks to achieve the overall best performance. Our model tightly couples two components: a mixture component used for discovering latent groups in document collection and a topic model component used for mining multi-grain topics including local topics specific to each cluster and global topics shared across clusters.We employ variational inference to approximate the posterior of hidden variables and learn model parameters. Experiments on two datasets demonstrate the effectiveness of our model

چکیده

خوشه بندی سند و مدل سازی عنوان دو عمل نزدیک و مرتبط به یکدیگر هستند که می توانند از یکدیگر سود ببرند. مدل سازی عنوان می تواند اسناد را در فضای عنوان قرار دهد که روش خوشه بندی موثر سند را تسهیل کنند. برچسب های خوشه که با خوشه بندی سند مشخص شده اند را می توان در مدل های عنوان گنجانید تا عناوین محلی خاص برای هر خوشه و عناوین کلی مشترک بین همه ی خوشه ها را استخراج کرد. در این مقاله، ما یک مدل عنوان خوشه بندی چند دانه ای MGCTM)) را پیشنهاد می کنیم که روش های خوشه بندی سند و مدلسازی عنوان را در یک چارچوب یکپارچه ادغام می کند و به طور مشترک دو عمل را انجام می دهد تا به بهترین عملکرد کلی دست یابد. مدل ما دو مولفه را به یکدیگر نزدیک می کند: یک جز ترکیبی که برای کشف گروه نهفته در مجموعه ی سند استفاده می شود و یک مولفه ی مدل عنوان که برای عناوین چند دانه از جمله عناوین محلی خاص هر خوشه و عناوین محلی مشترک بین خوشه ها مورد استفاده قرار می گیرند. ما روش استنتاج متغیر را به کار می گیریم تا روش دوم متغیرهای پنهان را تقریب بزنیم و پارامترهای مدل را فرا بگیریم. آزمایش ها روی دو مجموعه، اثر بخشی مدل ما را نشان می دهند.

1-مقدمه

در حوزه ی متنی، خوشه بندی سند (آگاروال و ژای، 2012؛ کای و همکاران، 2011؛ لو و همکاران، 2011، NG و همکاران، 2002؛ خو و گونگ، 2004؛ خو و همکاران، 2003) و مدل سازی عنوان (بلی و همکاران، 2003، هافمن، 2001) دو مسئله ای هستند که به طور گسترده مطالعه شده اند و کاربردهای بسیاری دارند. هدف از خوشه بندی سند این است که اسناد مشابه را به گروه ها سازماندهی کنیم که این کار برای سازماندهی اسناد، مرو، خلاصه سازی و طبقه بندی و بازیابی بسیار مهم هستند...



این مقاله ترجمه شده مهندسی فناوری اطلاعات در زمینه کلمات کلیدی زیر است:





Document Clustering
Topic Modeling
MGCTM
multi-grain clustering topic model

ثبت سفارش جدید