چکیده
قابلیت روبه رشد جستجو و جمع آوری دادههایی زیاد با استفاده از تکنولوژی سخت افزاری کنونی، منجر به توجهی خاص به توسعه الگوریتمهای داده کاوی شده است که شخص کاربر را حفظ میکند. تکنیکی جدید، مسئله حفظ محرمانگی را با به هم ریختن و بازسازی توزیعهای داده در یک سطح مجتمع بمنظور اجرای داده کاوی بیان میکند.این متد، قادر است تا محرمانگی را با وجود دسترسی اطلاعات ضمنی خصیصههای اصلی حفظ نماید. روند بازسازی توزیعها به طور طبیعی منجر به از دست رفتن اطلاعات میشود که در بسیاری از موقعیتهای عملی قابل قبول است.این مقاله یک الگوریتم ماکسیمم سازی انتظار (EM) را برای بازسازی توزیعها تشریح میکند که از متدهای کنونی از نظر سطح از دست رفتن اطلاعات موثرتر است. به خصوصاینکه ثابت میکنیم که الگوریتم EM به تخمین احتمال ماکسیمم توزیعهای اصلی براساس داده به هم ریخته تمایل پیدا میکند. نشان میدهیم که وقتی داده بزرگی دردسترس باشد، الگوریتم EM، تخمینهایی باثبات از توزیعهای اصلی ارائه میدهد. معیارهایی را برای کمیت سازی و اندازه گیری الگوریتمهای داده کاوی باحفظ محرمانگی پیشنهاد میدهیم. بنابرایناین مقاله بنیانی برای اندازه گیری تاثیر الگوریتمهای داده کاوی باحفظ محرمانگی فراهم میکند. معیارهای محرمانگی ما، نتایج جالبی را در رابطه با تاثیر توزیعهای به ریخته مختلف نشان میدهد.
فهرست مطالب
1-مقدمه
2-کمیت سازی محرمانگی
3-کمیت سازی از دست رفتن اطلاعات
4-یک الگوریتم EM برای بازسازی موثر توزیع
1-4-اشتقاق الگوریتم بازسازی EM
2-4-الگوریتم EM بازسازی
3-4-ویژگیهای همگرایی الگوریتم بازسازیEM
5-نتایج تجربی
6-نتیجه وخلاصه
7-منابع
میتوانید از لینک ابتدای صفحه، مقاله انگلیسی را رایگان دانلود فرموده و چکیده انگلیسی و سایر بخش های مقاله را مشاهده فرمایید.