تکنولوژی Memory RAS و پشتیبانی از ECC پیشرفته
در این مطلب به بررسی Advanced ECC support در سرورهای اچ پی خواهیم پرداخت و یا خواهیم گفت که چگونه advanced ECC support را فعال کنیم؟
خرید سرور اچ پی با گارانتی معتبر و قیمت عالی
فهرست محتوا
میرور کردن حافظه با Advanced ECC Support
حافظهی آینهای با پشتیبانی از تصحیح خطای پیشرفته، از سیستم در برابر خطاهای غیرقابل اصلاحی که منجر به خرابی میشوند، محافظت میکند. دو حالت برای این قابلیت وجود دارد: پشتیبانی کامل از حافظهی آینهای و پشتیبانی جزئی از حافظهی آینهای.
پشتیبانی کامل از حافظهی آینهای: نیمی از ظرفیت حافظهی سیستم را برای نگهداری یک کپی از تمام دادهها مورد استفاده قرار میدهد.
پشتیبانی جزئی از حافظهی آینهای: به کاربر این امکان را میدهد تا مقدار کمتری از حافظهی سیستم را برای آینهسازی اختصاص دهد. این قابلیت از طریق نصب مدلهای سطح بالای پردازندهها (SKU)، مثل پردازندههای پلاتینیوم زئون و گلد اینتل پشتیبانی میشود.
اگر خطای غیرقابل اصلاحی در ناحیهی محافظتشدهی حافظهی آینهای رخ دهد، سیستم به طور خودکار دادهی صحیح را از کپی پشتیبان بازیابی میکند تا سیستم بدون دخالت کاربر به کار عادی خود ادامه میدهد. با ارائهی افزونگی (redundancy) اضافی در زیرسامانهی حافظه، آینهسازی حافظه بیشترین سطح محافظت در برابر خرابی حافظهای که توسط ECC، SDDC، DDDC، ADDDC و حافظهی online spare اصلاح نمیشوند، ارائه میدهد.
ویژگیهای میرور کردن حافظه با Advanced ECC Support
با فعال کردن حافظهی آینهای کامل، تنها نیمی از حافظهی نصب شده در اختیار سیستم قرار میگیرد. از آنجایی که آینهسازی کامل حافظه ۵۰ درصد از ظرفیت حافظهی سیستم را مصرف میکند، این قابلیت برای حجمهای کاری سرور که باید بالاترین سطح محافظت در برابر خرابیهای ماژولهای حافظه را دریافت کنند، در نظر گرفته میشود. شما ممکن است تمایل داشته باشید، برای حجمهای کاری که نباید از دسترس خارج شوند و نمیتوان برای تعویض ماژولهای حافظهی رو به خرابی تا زمان خاموشی برنامهریزیشده، آنها را از دسترس خارج کرد از آینهسازی حافظه استفاده کنید.
قرینهسازی/آینهسازی خرد/جزئی حافظه (Partial memory) توسط کاربر قابل پیکربندی است و از حالتهای مختلفی به شرح زیر پشتیبانی میکند:
- پیکربندی توسط سیستمعامل (OS configured)
- ۴ گیگابایت اول حافظهی سرور
- ۱۰ درصد یا ۲۰ درصد از حافظه بالاتر از ۴ گیگابایت
برای اطلاعات بیشتر در مورد پشتیبانی از آینهسازی جزئی حافظه بهتر است مستندات سیستمعامل را مورد بررسی قرار دهید. تاثیر عملکردی پیادهسازی آینهسازی حافظه به طور کلی بسیار ناچیز است. از آنجایی که آینهسازی جزئی حافظه از حافظهی کمتری استفاده میکند، هزینه پیادهسازی آن میتواند به میزان قابل توجهی از آینهسازی کامل حافظه پایینتر باشد.
بیشتر بدانید
نیازمندیهای میرور کردن حافظه با Advanced ECC Support
پلتفرمهای سرور پرولیانت اچ پی نسل ۱۱ از آینهسازی چهار کاناله پشتیبانی میکنند. این حالت تنها بر روی سیستمهایی با پیکربندی ۸ یا ۱۶ ماژول رم (DIMM) پشتیبانی میشود.
آینهسازی کامل حافظه بر روی یک کنترلر حافظهی یکپارچه (IMC) انجام میشود. این کار بر روی هر دو IMC صورت نمیگیرد، بنابراین هر کدام به طور مستقل از دیگری آینهسازی را اجرا میکنند. در آینهسازی جزئی حافظه از همان قوانین بارگذاری پیروی میشود که برای آینهسازی کامل پشتیبانی میشود.
چگونه Memory Mirroring را فعال کنیم؟
پشتیبانی از حافظهی آینهای را میتوان در RBSU با پیکربندی گزینهی پیشرفتهی محافظت از حافظه تحت عنوان «حافظهی آینهای با تصحیح خطای پیشرفته (Mirrored Memory with Advanced ECC)» فعال کرد. برای آینهسازی کامل حافظه، کاربر نیمی از بانکهای حافظه را به عنوان حافظهی سیستم و بانکهای باقیمانده را به عنوان حافظهی آینهای اختصاص میدهد. پیکربندی تمام بانکها باید یکسان باشد.
برای پیکربندی آینهسازی جزئی حافظه، دو کار لازم است تا انجام شود:
۱. تنظیم گزینهی پیشرفتهی محافظت از حافظه (Advanced Memory Protection option) به حافظهی آینهای با تصحیح خطای پیشرفت (Mirrored Memory with Advanced ECC).
۲. تنظیم حالت آینهسازی حافظه (Memory Mirroring Mode) به یکی از حالتهای مناسب.
Memory scrubbing (Patrol and Demand) چیست؟
پاکسازی حافظه (scrubbing) یک قابلیت استاندارد Memory RAS است که برای جلوگیری از انباشته شدن خطاهای نرم (soft errors) در حافظه و در نهایت تبدیل شدن آنها به خطاهای غیرقابل اصلاح طراحی شده است. این کار با بازنویسی پیشگیرانهی دادههای صحیح به حافظه در هر بار تشخیص خطا انجام میشود.
در سیستمهای امروزی دو نوع اسکرابینگ وجود دارد: اسکرابینگ گشتی (patrol scrubbing) و اسکرابینگ درخواستی (demand scrubbing). هر دو کار یکسانی انجام میدهند، به محض یافتن خطا، آن را در حافظه اصلاح میکنند. تفاوت در نحوهی یافتن خطا است. اسکرابینگ گشتی، یک جستجوی پیشگیرانهی مداوم برای خطاهایی است که در پسزمینه رخ میدهند، در حالی که اسکرابینگ درخواستی تنها زمانی اتفاق میافتد که حافظه توسط سیستمعامل یا برنامه خوانده شود.
ویژگیهای اسکرابینگ گشتی (Patrol Scrubbing)
هنگامی که اسکرابینگ گشتی فعال میشود، به طور پیشگیرانه حافظهی سیستم را برای خطاهای قابل اصلاح جستجو میکند و آنها را تعمیر میکند. این کار از انباشته شدن خطاهای تک بیتی که با عبور از تعداد مجاز خطاهای قابل اصلاح یا تبدیل شدن به خطاهای چند بیتی، غیرقابل اصلاح میشوند، جلوگیری میکند. برای هر کنترلر حافظهی یکپارچه (IMC) یک اسکرابینگ گشتی وجود دارد.
حداقل الزامات برای Memory scrubbing
برای اسکرابینگ گشتی به قوانین خاصی برای توزیع حافظه یا تنظیمات RBSU نیاز نیست. این قابلیت به طور پیشفرض روی پلتفرمهای Eagle Stream فعال است و میتواند توسط کاربر غیر فعال شود. اسکرابینگ درخواستی همیشه به طور پیشفرض فعال است و امکان غیر فعال کردن آن وجود ندارد.
خرید dl360 g11 در نتسا با گارانتی معتبر
نحوه فعال سازی patrol scrubbing
به طور پیشفرض، اسکرابینگ گشتی برای هر حالت «محافظت پیشرفتهی حافظه» انتخابشده در بخش RBSU >> Memory Options وجود دارد.
جزئیات فنی اسکرابینگ گشتی
بایوس (BIOS) موتور اسکرابینگ گشتی را در زمان بوت (راهاندازی) فعال میکند و فاصلهی زمانی بین هر پاکسازی را تنظیم میکند. فرآیند پاکسازی شامل موارد زیر است:
خواندن تکبهتک تمام خطوط کش (cache line) حافظه یک بار در روز برای بررسی خطا.
در صورت یافتن خطا، دادهی صحیح به حافظه بازنویسی میشود.
هدف از اسکرابینگ گشتی اطمینان از این موضوع است که خطاهای قابل اصلاح برای مدت طولانی در حافظهی رم (DRAM) باقی نمانند تا احتمال ترکیب شدن آنها با یک خطای گذرا (transient error) و ایجاد یک خطای غیرقابل اصلاح کاهش پیدا کند. اسکرابینگ گشتی در تمامی حالتهای RAS حافظه، مانند تصحیح خطای پیشرفته (ECC)، آینهسازی و صرفنظر از ردیف (rank sparing) کار میکنند و نقش موثری در کاهش رویدادهای غیرقابل اصلاح دارند.
کلام آخر
ترکیب قابلیتها ذکر شده در این مقاله، به طور فعال حافظه سیستم را جستجو می کند و خطاهای قابل اصلاح را ، اصلاح می کند و از تجمع خطاهای تک بیتی جلوگیری می کند. بنابراین، از کار انداختن آن با خطراتی همراه است.
تقاضا برای سرورهایی با ظرفیت حافظهی بیشتر همچنان رو به افزایش است. این تقاضا توسط برنامههای کاربردی پیچیدهتر و پرمصرف حافظه و همچنین پردازندههای قدرتمندتر هدایت میشود. در حالی که تامین نیاز به حافظهی سیستمی بیشتر مهم است، چالش پیش روی تولیدکنندگان سرور، حفظ قابلیت اطمینان سیستم حافظه است، حتی با افزایش احتمال خطاهای حافظه به دلیل بالا رفتن تراکم و ظرفیت حافظه.
شرکت اچ پی با فناوریهای تحمل خطای حافظه مانند online spare memory، حافظهی آینهای و آستانه خطای سریع اچ پی، به مقابله با این چالش پرداخته است. online spare memory برای مشتریانی مفید است که نمیتوانند در صورت بروز خطای حافظه، سرویسها را برای مدت زمان طولانی از دسترس خارج کنند، اما میتوانند تا زمان خاموشی برنامهریزیشده برای تعویض ماژولهای حافظهی معیوب، صبر کنند. حافظهی آینهای سطح بالاتری از در دسترس بودن را با یک گزینهی تحمل خطای بیشتر که از حفاظت کامل در برابر خطاهای تک بیتی و چند بیتی برخوردار است، ارائه میدهد. آستانه خطای سریع اچ پی، جدیدترین فناوری معرفیشده در سرورهای نسل ۱۱ HPE ProLiant/Synergy/Blade است که از پردازندههای مقیاسپذیر زئون اینتل استفاده میکند و همچنین قابلیت اطمینان و در دسترس بودن حافظه را به طور قابل توجهی برای مشتریان بهبود میبخشد. این فناوریهای پیشرفتهی محافظت از حافظهی اچپیئی به مشتریان این امکان را میدهند تا سیستمی را با سطح دلخواهی از در دسترس بودن حافظه انتخاب کنند تا استحکام راهحل نهایی خود را افزایش دهند.