Abstract
Erasure codes are an efficient means of storing data across a network in comparison to data replication, as they tend to reduce the amount of data stored in the network and offer increased resilience in the presence of node failures. The codes perform poorly though, when repair of a failed node is called for, as they typically require the entire file to be downloaded to repair a failed node. A new class of erasure codes, termed as regenerating codes were recently introduced, that do much better in this respect. However, given the variety of efficient erasure codes available in the literature, there is considerable interest in the construction of coding schemes that would enable traditional erasure codes to be used, while retaining the feature that only a fraction of the data need be downloaded for node repair. In this paper, we present a simple, yet powerful, framework that does precisely this. Under this framework, the nodes are partitioned into two types and encoded using two codes in a manner that reduces the problem of node-repair to that of erasure-decoding of the constituent codes. Depending upon the choice of the two codes, the framework can be used to avail one or more of the following advantages: simultaneous minimization of storage space and repair-bandwidth, low complexity of operation, fewer disk reads at helper nodes during repair, and error detection and correction
چکیده
کدهای حک، ابزارهای مفیدی هستند برای ذخیره سازی اطلاعات در یک شبکه در مقایسه با تکرار آنها، که نتیجه این ذخیره سازی، کاهش حجم اطلاعات ذخیره شده در شبکه و افزایش انعطاف شبکه در صورت معیوب شدن نودها است. عملکرد کدها مناسب نیست، از این رو وقتی دستور اصلاح یک کد معیوب فراخوانی می شود، لازم است که یک فایل صحیح، برای اصلاح کد معیوب دانلود شود. دسته جدیدی از کدهای حک، که با نام کدهای بازیابی نیز نامیده می شود، اخیراً معرفی شده اند که برای اصلاح کدهای معیوب، عملکرد خیلی بهتری دارند. با وجود کدهای حک متفاوت موجود در مقالات و تحقیقات، توجه ویژه ای وجود دارد به ساختار روش ها و طرح های کدینگ که امکان استفاده از کدهای حک قدیمی و سنتی را فراهم می آورد، در حالی که این کدها این ویژگی را دارا می باشند که تنها بخشی از داده ها می بایست برای اصلاح نود، دانلود شوند. در این مقاله، ما یک چارچوب ساده و قدرتمند را معرفی می کنیم که ویژگی های مذکور را با دقت بالا، دارا می باشد. در این چارچوب، نودها به دو نوع خاص بخش بندی می شوند و به وسیله دو کد خاص نیز اینکد می گردند که هدف از آن کاهش مشکلات مربوط به اصلاح نود است که این مشکلات هنگام دیکدینگ کدهای سازنده به وجود می آید. بسته به انتخاب دو کد خاص، چارچوب معرفی شده در این مقاله می تواند یک یا چند مزیت زیر را نتیجه دهد: مینیمم سازی هم زمان فضای ذخیره سازی و پهنای باند تصحیح، کاهش پیچیدگی عملکرد، عدم نیاز به فراخوانی اطلاعات از روی دیسک در نودهای کمکی در طول پروسه اصلاح نود و در نهایت نیز تشخیص و تصحیح خطاهای احتمالی.
1-مقدمه
در سیستم های ذخیره سازی پراکنده، یک فایل اطلاعات (به نام پیام)، بین نودهای شبکه توزیع می شود به گونه ای که یک کاربر نهایی (که همچنین کلکتور داده نیز نامیده می شود) می تواند با اتصال به نودهای مجاور، پیام را بازیابی کند. این موضوع که سیستم ذخیره سازی پراکنده از قابلیت اطمینان بالایی برخوردار باشد و نیز از منابع شبکه نظیر ذخیره سازی و پهنای باند شبکه به صورت مفید استفاده کند، یک امر مطلوب است...