تکنولوژی Memory RAS و پشتیبانی از ECC پیشرفته

در این مطلب به بررسی Advanced ECC support در سرورهای اچ پی خواهیم پرداخت و یا خواهیم گفت که چگونه advanced ECC support را فعال کنیم؟

 

میرور کردن حافظه با Advanced ECC Support

حافظه‌ی آینه‌ای با پشتیبانی از تصحیح خطای پیشرفته، از سیستم در برابر خطاهای غیرقابل اصلاحی که منجر به خرابی می‌شوند، محافظت می‌کند. دو حالت برای این قابلیت وجود دارد: پشتیبانی کامل از حافظه‌ی آینه‌ای و پشتیبانی جزئی از حافظه‌ی آینه‌ای.

پشتیبانی کامل از حافظه‌ی آینه‌ای: نیمی از ظرفیت حافظه‌ی سیستم را برای نگهداری یک کپی از تمام داده‌ها مورد استفاده قرار می‌دهد.

پشتیبانی جزئی از حافظه‌ی آینه‌ای: به کاربر این امکان را می‌دهد تا مقدار کمتری از حافظه‌ی سیستم را برای آینه‌سازی اختصاص دهد. این قابلیت از طریق نصب مدل‌های سطح بالای پردازنده‌‌ها (SKU)، مثل پردازنده‌های پلاتینیوم زئون و گلد اینتل پشتیبانی می‌شود.

اگر خطای غیرقابل اصلاحی در ناحیه‌ی محافظت‌شده‌ی حافظه‌ی آینه‌ای رخ دهد، سیستم به طور خودکار داده‌ی صحیح را از کپی پشتیبان بازیابی می‌کند تا سیستم بدون دخالت کاربر به کار عادی خود ادامه می‌دهد. با ارائه‌ی افزونگی (redundancy) اضافی در زیرسامانه‌ی حافظه، آینه‌سازی حافظه بیشترین سطح محافظت در برابر خرابی حافظه‌ای که توسط ECC، SDDC، DDDC، ADDDC و حافظه‌ی online spare اصلاح نمی‌شوند، ارائه می‌دهد.

ویژگی‌های میرور کردن حافظه با Advanced ECC Support

با فعال کردن حافظه‌ی آینه‌ای کامل، تنها نیمی از حافظه‌ی نصب ‌شده در اختیار سیستم قرار می‌گیرد. از آنجایی که آینه‌سازی کامل حافظه ۵۰ درصد از ظرفیت حافظه‌ی سیستم را مصرف می‌کند، این قابلیت برای حجم‌های کاری سرور که باید بالاترین سطح محافظت در برابر خرابی‌های ماژول‌های حافظه را دریافت کنند، در نظر گرفته می‌شود. شما ممکن است تمایل داشته باشید، برای حجم‌های کاری که نباید از دسترس خارج شوند و نمی‌توان برای تعویض ماژول‌های حافظه‌ی رو به خرابی تا زمان خاموشی برنامه‌ریزی‌شده، آن‌ها را از دسترس خارج کرد از آینه‌سازی حافظه استفاده کنید.

قرینه‌سازی/آینه‌سازی خرد/جزئی حافظه (Partial memory) توسط کاربر قابل پیکربندی است و از حالت‌های مختلفی به شرح زیر پشتیبانی می‌کند:

  • پیکربندی توسط سیستم‌عامل (OS configured)
  • ۴ گیگابایت اول حافظه‌ی سرور
  • ۱۰ درصد یا ۲۰ درصد از حافظه بالاتر از ۴ گیگابایت

برای اطلاعات بیشتر در مورد پشتیبانی از آینه‌سازی جزئی حافظه بهتر است مستندات سیستم‌عامل را مورد بررسی قرار دهید. تاثیر عملکردی پیاده‌سازی آینه‌سازی حافظه به طور کلی بسیار ناچیز است. از آنجایی که آینه‌سازی جزئی حافظه از حافظه‌ی کمتری استفاده می‌کند، هزینه پیاده‌سازی آن می‌تواند به میزان قابل توجهی از آینه‌سازی کامل حافظه پایین‌تر باشد.

نیازمندی‌های میرور کردن حافظه با Advanced ECC Support

پلتفرم‌های سرور پرولیانت اچ پی نسل ۱۱ از آینه‌سازی چهار کاناله پشتیبانی می‌کنند. این حالت تنها بر روی سیستم‌هایی با پیکربندی ۸ یا ۱۶ ماژول رم (DIMM) پشتیبانی می‌شود.

آینه‌سازی کامل حافظه بر روی یک کنترلر حافظه‌ی یکپارچه (IMC) انجام می‌شود. این کار بر روی هر دو IMC صورت نمی‌گیرد، بنابراین هر کدام به طور مستقل از دیگری آینه‌سازی را اجرا می‌کنند. در آینه‌سازی جزئی حافظه از همان قوانین بارگذاری پیروی می‌شود که برای آینه‌سازی کامل پشتیبانی می‌شود.

 


چگونه Memory Mirroring را فعال کنیم؟

پشتیبانی از حافظه‌ی آینه‌ای را می‌توان در RBSU با پیکربندی گزینه‌ی پیشرفته‌ی محافظت از حافظه تحت عنوان «حافظه‌ی آینه‌ای با تصحیح خطای پیشرفته (Mirrored Memory with Advanced ECC)» فعال کرد. برای آینه‌سازی کامل حافظه، کاربر نیمی از بانک‌های حافظه را به عنوان حافظه‌ی سیستم و بانک‌های باقی‌مانده را به عنوان حافظه‌ی آینه‌ای اختصاص می‌دهد. پیکربندی تمام بانک‌ها باید یکسان باشد.

برای پیکربندی آینه‌سازی جزئی حافظه، دو کار لازم است تا انجام شود:

۱. تنظیم گزینه‌ی پیشرفته‌ی محافظت از حافظه (Advanced Memory Protection option) به حافظه‌ی آینه‌ای با تصحیح خطای پیشرفت (Mirrored Memory with Advanced ECC).

۲. تنظیم حالت آینه‌سازی حافظه (Memory Mirroring Mode) به یکی از حالت‌های مناسب.


Memory scrubbing (Patrol and Demand) چیست؟

پاکسازی حافظه (scrubbing) یک قابلیت استاندارد Memory RAS است که برای جلوگیری از انباشته شدن خطاهای نرم (soft errors) در حافظه و در نهایت تبدیل شدن آن‌ها به خطاهای غیرقابل اصلاح طراحی شده است. این کار با بازنویسی پیشگیرانه‌ی داده‌های صحیح به حافظه در هر بار تشخیص خطا انجام می‌شود.

در سیستم‌های امروزی دو نوع اسکرابینگ وجود دارد: اسکرابینگ گشتی (patrol scrubbing) و اسکرابینگ درخواستی (demand scrubbing). هر دو کار یکسانی انجام می‌دهند، به محض یافتن خطا، آن را در حافظه اصلاح می‌کنند. تفاوت در نحوه‌ی یافتن خطا است. اسکرابینگ گشتی، یک جستجوی پیشگیرانه‌ی مداوم برای خطاهایی است که در پس‌زمینه رخ می‌دهند، در حالی که اسکرابینگ درخواستی تنها زمانی اتفاق می‌افتد که حافظه توسط سیستم‌عامل یا برنامه خوانده شود.

 

ویژگی‌های اسکرابینگ گشتی (Patrol Scrubbing)

هنگامی که اسکرابینگ گشتی فعال می‌شود، به طور پیشگیرانه حافظه‌ی سیستم را برای خطاهای قابل اصلاح جستجو می‌کند و آن‌ها را تعمیر می‌کند. این کار از انباشته شدن خطاهای تک ‌بیتی که با عبور از تعداد مجاز خطاهای قابل اصلاح یا تبدیل شدن به خطاهای چند بیتی، غیرقابل اصلاح می‌شوند، جلوگیری می‌کند. برای هر کنترلر حافظه‌ی یکپارچه (IMC) یک اسکرابینگ گشتی وجود دارد.

حداقل الزامات برای Memory scrubbing

برای اسکرابینگ گشتی به قوانین خاصی برای توزیع حافظه یا تنظیمات RBSU نیاز نیست. این قابلیت به طور پیش‌فرض روی پلتفرم‌های Eagle Stream فعال است و می‌تواند توسط کاربر غیر فعال شود. اسکرابینگ درخواستی همیشه به طور پیش‌فرض فعال است و امکان غیر فعال کردن آن وجود ندارد.


نحوه فعال سازی patrol scrubbing

به طور پیش‌فرض، اسکرابینگ گشتی برای هر حالت «محافظت پیشرفته‌ی حافظه» انتخاب‌شده در بخش RBSU >> Memory Options  وجود دارد.

جزئیات فنی اسکرابینگ گشتی

بایوس (BIOS) موتور اسکرابینگ گشتی را در زمان بوت (راه‌اندازی) فعال می‌کند و فاصله‌ی زمانی بین هر پاکسازی را تنظیم می‌کند. فرآیند پاکسازی شامل موارد زیر است:

خواندن تک‌به‌تک تمام خطوط کش (cache line) حافظه یک بار در روز برای بررسی خطا.

در صورت یافتن خطا، داده‌ی صحیح به حافظه بازنویسی می‌شود.

هدف از اسکرابینگ گشتی اطمینان از این موضوع است که خطاهای قابل اصلاح برای مدت طولانی‌ در حافظه‌ی رم (DRAM) باقی نمانند تا احتمال ترکیب شدن آن‌ها با یک خطای گذرا (transient error) و ایجاد یک خطای غیرقابل اصلاح کاهش پیدا کند. اسکرابینگ گشتی در تمامی حالت‌های RAS حافظه، مانند تصحیح خطای پیشرفته (ECC)، آینه‌سازی و صرف‌نظر از ردیف (rank sparing) کار می‌کنند و نقش موثری در کاهش رویدادهای غیرقابل اصلاح دارند.

کلام آخر

ترکیب قابلیت‌ها ذکر شده در این مقاله، به طور فعال حافظه سیستم را جستجو می کند و خطاهای قابل اصلاح را ، اصلاح می کند و از تجمع خطاهای تک بیتی جلوگیری می کند. بنابراین، از کار انداختن آن با خطراتی همراه است.

تقاضا برای سرورهایی با ظرفیت حافظه‌ی بیشتر همچنان رو به افزایش است. این تقاضا توسط برنامه‌های کاربردی پیچیده‌تر و پرمصرف حافظه و همچنین پردازنده‌های قدرتمندتر هدایت می‌شود. در حالی که تامین نیاز به حافظه‌ی سیستمی بیشتر مهم است، چالش پیش روی تولیدکنندگان سرور، حفظ قابلیت اطمینان سیستم حافظه است، حتی با افزایش احتمال خطاهای حافظه به دلیل بالا رفتن تراکم و ظرفیت حافظه.

شرکت اچ پی با فناوری‌های تحمل خطای حافظه مانند online spare memory، حافظه‌ی آینه‌ای و آستانه خطای سریع اچ پی، به مقابله با این چالش پرداخته است. online spare memory برای مشتریانی مفید است که نمی‌توانند در صورت بروز خطای حافظه، سرویس‌ها را برای مدت زمان طولانی از دسترس خارج کنند، اما می‌توانند تا زمان خاموشی برنامه‌ریزی‌شده برای تعویض ماژول‌های حافظه‌ی معیوب، صبر کنند. حافظه‌ی آینه‌ای سطح بالاتری از در دسترس بودن را با یک گزینه‌ی تحمل خطای بیشتر که از حفاظت کامل در برابر خطاهای تک ‌بیتی و چند بیتی برخوردار است، ارائه می‌دهد. آستانه خطای سریع اچ پی، جدیدترین فناوری معرفی‌شده در سرورهای نسل ۱۱ HPE ProLiant/Synergy/Blade است که از پردازنده‌های مقیاس‌پذیر زئون اینتل استفاده می‌کند و همچنین قابلیت اطمینان و در دسترس بودن حافظه را به طور قابل توجهی برای مشتریان بهبود می‌بخشد. این فناوری‌های پیشرفته‌ی محافظت از حافظه‌ی اچ‌پی‌ئی به مشتریان این امکان را می‌دهند تا سیستمی را با سطح دلخواهی از در دسترس بودن حافظه انتخاب کنند تا استحکام راه‌حل نهایی خود را افزایش دهند.

 

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیشنهاد ویژه نتسا