Abstract
For the space application, single event upset (SEU) is one of the important causes of fault or even failure of system on chip (SOC), the error detection and correction (EDAC) technique is often adopted to protect memory cells in SOC against SEU error. To improve the EDAC ability and to decrease the area overhead of storing check-bits, a interleaving grouping Hamming code algorithm about 32-bit data is proposed. Each 32-bit data are divided crosswise into 2 groups, each group adopts a single error correction and double error detection (SEC-DED) (22, 16) Hamming code, and the check-bits are interleaved storage. The number of the check-bits is only two thirds of that of the double error correction and four error detection Bose-Claudhuri-Hocquenghem (BCH) code. The proposed method can correct all burst 2-bit error, and can detect all burst no greater than 5-bit error, otherwise, part 3-bit to 24-bit faults can be also detected. The concrete encoder and decoder are implemented, and a greedy algorithm is developed to minimize hardware area overhead. The 136×32 bits register file uses this design to protect against SEU error, the order of magnitude of SEU failure rate is the same with that of using BCH code technique
چکیده
در برنامه های فضایی، شکست منفرد رخداد (SEU) یکی از دلایل مهم خطا یا حتی شکست سیستم بر تراشه (SOC) است، روش تشخیص و اصلاح خطا (EDAC) معمولاً برای حفاظت سلول های حافظه ی SOC در برابر خطای SEU به کار میرود. برای افزایش قدرت EDAC و کاهش سربار مساحت ذخیره سازی چک-بیت ها (بیتهای بررسی)، یک الگوریتم کد همینگ گروهی با جایگذاری برای داده های 32 بیتی ارائه شده است. هر داده 32 بیتی به 2 گروه تقسیم می شود که هر گروه با کد همینگ، خطای یک بیتی را اصلاح و خطای دو بیتی را تشخیص (22,16) (SEC-DED) میدهد و چک-بیتها در حافظه جایگذاری می شوند. تعداد چک-بیتها فقط دو سوم همین تعداد در اصلاح خطای دو بیتی و تشخیص خطای چهار بیتی با استفاده از کد Bose-Claudhuri- Hocquenghem BCH است. روش پیشنهادی میتواند تمام خطاهای دوبیتی متوالی را اصلاح کند، و میتواند تمام خطاهای متوالی که بیشتر از 5 بیت نباشند را تشخیص دهد، در غیر این صورت، بخشی از خطاهای 3 بیتی تا 24 بیتی نیز قابل تشخیص است. رمزگذار و رمزگشای واقعی پیاده سازی شده و یک الگوریتم حریصانه برای حداقل کردن سربار مساحت سخت افزار به کار میرود. فایل رجیستر 136x32 از این طراحی برای حفاظت در برابر خطای SEU استفاده می کند، بزرگی درجه ی شکست SEU مشابه با استفاده از روش کدگذاری BCH است.
1-مقدمه
در برنامه های فضایی، شکست منفرد رخداد (SEU) یکی از دلایل مهم تولید خطا در بخشهای حافظه در تراشه است. اگر این خطاها به موقع اصلاح نشوند، داده های مورد استفاده ی سیستم، اشتباه خواهد بود. مشکلات قابلیت اعتماد برای برنامه فضایی بسیار مهم هستند...