Skip Navigation Linksلیست مقالات ترجمه شده / مقالات ترجمه شده مهندسی كامپيوتر /

عنوان ترجمه شده مقاله: ادغام خوشه بندی سند و مدلسازی عنوان

خوشه بندی سند و مدلسازی عنوان دو عمل نزدیک و مرتبط به یکدیگر هستند که می توانند از یکدیگر سود ببرند. مدل سازی عنوان می تواند اسناد را در فضای عنوان قرار دهد که روش خوشه بندی موثر سند را تسهیل کنند
Abstract

Document clustering and topic modeling are two closely related tasks which can mutually benefit each other. Topic modeling can project documents into a topic space which facilitates effective document clustering. Cluster labels discovered by document clustering can be incorporated into topic models to extract local topics specific to each cluster and global topics shared by all clusters. In this paper, we propose a multi-grain clustering topic model (MGCTM) which integrates document clustering and topic modeling into a unified framework and jointly performs the two tasks to achieve the overall best performance. Our model tightly couples two components: a mixture component used for discovering latent groups in document collection and a topic model component used for mining multi-grain topics including local topics specific to each cluster and global topics shared across clusters.We employ variational inference to approximate the posterior of hidden variables and learn model parameters. Experiments on two datasets demonstrate the effectiveness of our model

چکیده

خوشه بندی سند و مدل سازی عنوان دو عمل نزدیک و مرتبط به یکدیگر هستند که می توانند از یکدیگر سود ببرند. مدل سازی عنوان می تواند اسناد را در فضای عنوان قرار دهد که روش خوشه بندی موثر سند را تسهیل کنند. برچسب های خوشه که با خوشه بندی سند مشخص شده اند را می توان در مدل های عنوان گنجانید تا عناوین محلی خاص برای هر خوشه و عناوین کلی مشترک بین همه ی خوشه ها را استخراج کرد. در این مقاله، ما یک مدل عنوان خوشه بندی چند دانه ای MGCTM)) را پیشنهاد می کنیم که روش های خوشه بندی سند و مدلسازی عنوان را در یک چارچوب یکپارچه ادغام می کند و به طور مشترک دو عمل را انجام می دهد تا به بهترین عملکرد کلی دست یابد. مدل ما دو مولفه را به یکدیگر نزدیک می کند: یک جز ترکیبی که برای کشف گروه نهفته در مجموعه ی سند استفاده می شود و یک مولفه ی مدل عنوان که برای عناوین چند دانه از جمله عناوین محلی خاص هر خوشه و عناوین محلی مشترک بین خوشه ها مورد استفاده قرار می گیرند. ما روش استنتاج متغیر را به کار می گیریم تا روش دوم متغیرهای پنهان را تقریب بزنیم و پارامترهای مدل را فرا بگیریم. آزمایش ها روی دو مجموعه، اثر بخشی مدل ما را نشان می دهند.

1-مقدمه

در حوزه ی متنی، خوشه بندی سند (آگاروال و ژای، 2012؛ کای و همکاران، 2011؛ لو و همکاران، 2011، NG و همکاران، 2002؛ خو و گونگ، 2004؛ خو و همکاران، 2003) و مدل سازی عنوان (بلی و همکاران، 2003، هافمن، 2001) دو مسئله ای هستند که به طور گسترده مطالعه شده اند و کاربردهای بسیاری دارند. هدف از خوشه بندی سند این است که اسناد مشابه را به گروه ها سازماندهی کنیم که این کار برای سازماندهی اسناد، مرو، خلاصه سازی و طبقه بندی و بازیابی بسیار مهم هستند...


موسسه ترجمه البرز اقدام به ترجمه مقاله " مهندسی فناوری اطلاعات " با موضوع " ادغام خوشه بندی سند و مدلسازی عنوان " نموده است که شما کاربر عزیز می توانید پس از دانلود رایگان مقاله انگلیسی و مطالعه ترجمه چکیده و بخشی از مقدمه مقاله، ترجمه کامل مقاله را خریداری نمایید.
عنوان ترجمه فارسی
ادغام خوشه بندی سند و مدلسازی عنوان
نویسنده/ناشر/نام مجله :
arXiv
سال انتشار
2013
کد محصول
1009124
تعداد صفحات انگليسی
10
تعداد صفحات فارسی
19
قیمت بر حسب ریال
968,000
نوع فایل های ضمیمه
Pdf+Word
حجم فایل
850 کیلو بایت
تصویر پیش فرض


این مقاله ترجمه شده را با دوستان خود به اشتراک بگذارید
سایر مقالات ترجمه شده مهندسی فناوری اطلاعات , مهندسی كامپيوتر را مشاهده کنید.
کاربر عزیز، بلافاصله پس از خرید مقاله ترجمه شده مقاله ترجمه شده و با یک کلیک می توانید مقاله ترجمه شده خود را دانلود نمایید. مقاله ترجمه شده خوداقدام نمایید.
جهت خرید لینک دانلود ترجمه فارسی کلیک کنید
جستجوی پیشرفته مقالات ترجمه شده
برای کسب اطلاعات بیشتر، راهنمای فرایند خرید و دانلود محتوا را ببینید
هزینه این مقاله ترجمه شده 968000 ریال بوده که در مقایسه با هزینه ترجمه مجدد آن بسیار ناچیز است.
اگر امکان دانلود از لینک دانلود مستقیم به هر دلیل برای شما میسر نبود، کد دانلودی که از طریق ایمیل و پیامک برای شما ارسال می شود را در کادر زیر وارد نمایید


این مقاله ترجمه شده مهندسی فناوری اطلاعات در زمینه کلمات کلیدی زیر است:





Document Clustering
Topic Modeling
MGCTM
multi-grain clustering topic model

تاریخ انتشار در سایت: 2016-10-25
جستجوی پیشرفته مقالات ترجمه شده
نظرتان در مورد این مقاله ترجمه شده چیست؟

ثبت سفارش جدید