چکیده
در طی دو دههی اخیر، فناوری XML با پیشرفت قابل ملاحظهای در حوزهی تشخیص دادههای نیمه ساختیافته و مبادلهی دادهها از طریق وب همراه بوده است. در همین راستا بکار گیری تکنیک های داده کاوی بر روی دادههای XML به یک ضرورت مبدل گردیده است. الگوریتم خوشهبندی K-MEAN یا کی-میانگین را میتوان یکی از رایجترین الگوریتم ها برای خوشهبندی داده کاوی دانست. اخیراً تحقیقاتی بر روی کاوش دادههای XML صورت گرفته است. در این مقاله از الگوریتم خوشهبندی K-Mean برای خوشهبندی دادههای XML استفاده میکنیم. این الگوریتم اقدام به انتخاب نقاط محوری نموده و سپس دادههای XML را بر اساس این نقاط محوری گروهبندی میسازد. فاصلهی مقایسه در بین هر المان، بر اساس هر نقطهی محوری تغییر کرده و باعث شده تا گروههایی از اِلمان ها در کنار یکدیگر شکل گیرند. نزدیکترین المان ها به همدیگر در یک گروه قرار میگیرند. فاصلهها را با استفاده از الگوریتم منهتن اندازهگیری میکنیم. در این تحقیق، اپلیکشن خاصی را ارائه میدهیم که به کاربر اجازه میدهد تا یک فایل XML را آپلود کرده و فیلد هدف و تعداد خوشهها را خودش انتخاب نماید. در نتیجه این اپلیکیشن میتواند نقاط محوری و خوشههایی که در همهی گام ها بکار گرفته شده است را نمایش دهد.
1-مقدمه
با توجه به توسعهی فناوری وب، دادههای XML در طی دو دههی اخیر بسیار رشد داشتهاند. اخیراً از این فناوری ها برای ذخیرهسازی و انتقال دادهها استفاده میشود. در نتیجه، فناوری XML مورد توجه گستردهای در حوزهی پایگاههای دادهای قرار گرفته است چرا که XML توسط انسان نوشته میشود و نه کامپیوتر...
میتوانید از لینک ابتدای صفحه، مقاله انگلیسی را رایگان دانلود فرموده و چکیده انگلیسی و سایر بخش های مقاله را مشاهده فرمایید