نتسا مقالات Data Replication چیست؟ تکنیک‌های تکثیر داده‌ها

logo

Data Replication چیست؟ تکنیک‌های تکثیر داده‌ها

دسته بندی: مقالات
توسط : netssa 0 دیدگاه
05 ژانویه 2022

عمل تکثیر یکی از وظایف مهم سرپرستان شبکه به شمار می‌رود. تکثیر هنگامی انجام می‌شود که قرار است تغییرات مهمی در اطلاعات به وجود آید یا ضروری است از اطلاعات پایگاه‌های داده‌ای یک کپی یکسان گرفته شود. در این حالت اگر اطلاعات شرکت به هر دلیلی از بین برود یک نسخه پشتیبان برای بازگرداندن اطلاعات در دسترس قرار دارد.

 

Data Replication چیست؟

تکثیر از داده‌ها (Data Replication) به معنای تهیه نسخه یا نسخه‌های پشتیبان از اطلاعات میزبانی شده روی یک NAS و انتقال آن‌ها به NAS دیگری است تا در صورت بروز خرابی اطلاعات اصلی، یک کپی دایمی از اطلاعات در دسترس باشد. مکان این ذخیره‌سازها می‌تواند متغیر باشد. به این معنا که ممکن است در همان شرکت، در شعب شرکت یا حتا شهر دیگری باشد. در این حالت اگر هر یک از ذخیره‌سازها به هر دلیلی با مشکل روبرو شد، اطلاعات دیگر دستگاه‌ها در دسترس بوده و سازمان قادر به بازگرداندن اطلاعات در کوتاه‌ترین زمان است.

برای آشنایی با ذخیره سازی تحت شبکه یا NAS کلیک کنید و مقاله را مطالعه کنید.

 

 

نکته مهمی که لازم است در ارتباط با تکثیر داده‌ها به آن دقت کنید این است که مفهوم فوق در تعامل با دسترس‌پذیری داده‌ها data availability و بازیابی پس از فاجعه disaster recovery است. با استفاده از فرآیند تکثیر داده‌ها می‌توانید اطلاعات مهم را روی شبکه‌های محلی، شبکه‌های گسترده، مراکز داده یا فضای ابری ذخیره‌ کنید. این‌کار به منظور مقابله با حوادث غیرمترقبه‌ای مثل خرابی سرور یا ذخیره‌ساز تحت شبکه انجام می‌شود. به‌طورمعمول شرکت‌ها از روش‌های مختلفی برای تکثیر و ذخیره‌سازی اطلاعات استفاده می‌کنند. جالب آن‌که حتا با گسترش روزافزون رایانش ابری، بازهم تکثیر داده‌ها اهمیت زیادی دارد.

برای آشنایی با انواع نسخه‌‌های پشتیبان‌گیری به مقاله معرفی روش های بکاپ‌گیری از اطلاعات سرور و شبکه مراجعه کنید.


کاربرد Data Replication

به‌طور کلی سازمان‌ها از مکانیزم تکثیر داده‌ها برای تهیه نسخه پشتیبان لحظه‌ای یا غیر لحظه‌ای از اطلاعات استفاده می‌کنند. با این‌حال، نکته مهمی که باید به آن دقت کنید به‌کارگیری الگوی درست است. در فرایند تکثیر داده ضروری است تا ارزیابی‌های دقیقی انجام شود. به‌طور مثال، یکی از مهم‌ترین نکاتی که باید به آن دقت کنید، پهنای باندی است که برای این منظور در دسترس‌تان قرار دارد. در مکانیزم تکثیر همزمان، کپی‌ کردن داده‌ها به شکل بلادرنگ انجام می‌شود. در چنین سناریوهایی باید پهنای باند کافی در دسترس باشد، با این‌حال، مزیت روش فوق این است که همواره نسخه‌ای قابل اعتماد از اطلاعات تهیه می‌شود. تکثیر همزمان (Synchronous Replication) نیازمند توان پردازشی و ذخیره‌سازی کافی است.

در صورت نبود این پیش‌نیازهای اولیه، شاهد کاهش عملکرد و کند شدن عملکرد سیستمی هستیم که اطلاعات از روی آن در حال کپی شدن است. نکته‌ای که باید در این زمینه به آن دقت کنید این است که فرایند تکثیر به دو روش همزمان و غیر همزمان انجام می‌شود. در روش تکثیر غیر همزمان Asynchronous Replication، کپی اطلاعات در زمان‌های مشخصی انجام می‌شود. به همین دلیل به پهنای باند کمی نیاز است و گزینه ایده‌الی برای کپی کردن اطلاعاتی است که دور از مکان اصلی شرکت قرار دارند. همان‌گونه که اشاره شد در روش همزمان، به‌شکل لحظه‌ای از اطلاعات یک نسخه پشتیبان تهیه می‌شود. رویکرد فوق به ویژه در ارتباط با بانک‌ها و موسسات مالی عملکرد خوبی دارد. با این‌حال، همان‌گونه که اشاره کردیم، نیازمند پهنای باند کافی هستید.


مفهوم تکثیر داده‌ها چیست؟

همان‌گونه که از نام این اصطلاح مشخص است، تکثیر داده‌ها به فرایند، کپی‌، همگام‌سازی، تهیه نسخه‌ای قابل اعتماد از اطلاعات و انتقال اطلاعات به مکان دیگری به غیر از محل ذخیره‌ساز اصلی اشاره دارد. این فرایند انتقال اطلاعات می‌تواند از طریق نرم‌افزارهای تخصصی، پروتکل‌های ارتباطی، یک رسانه سخت‌افزار خارجی یا از طریق مکانیزم‌های ابرمحور انجام شود. با توجه به این‌که سازمان‌های بزرگ از شبکه‌های ارتباطی مختلف و بعضا ترکیبی استفاده می‌کنند، این اختیار عمل را دارند که از روشی متناسب با نیاز کاری خود استفاده کنند. این فرایند می‌تواند از طریق رسانه‌های جانبی مثل فلش‌درایوها یا هارددیسک‌های خارجی، شبکه ذخیره‌ساز‌ (SAN) یا فضای ابری انجام شود.


تکنیک‌های Data Replication

 

 

همان‌گونه که اشاره شد، تکثیر داده‌ها با اهداف استمرار فعالیت‌های تجاری و حفظ پایایی شبکه‌ها و خدمات انجام می‌شود. امروزه سازمان‌های مختلف از سه رویکرد اصلی در ارتباط با تکثیر داده‌ها  به شرح زیر استفاده می‌کنند.

به‌کارگیری سیستم‌های همگام‌سازی: رویکرد همگام‌سازی عمدتا زمانی استفاده می‌شود که تغییرات مهمی در محل اتفاقات افتاده یا ضروری است از تغییرات اعمال شده در NASها یا سرورها به سرعت نسخه پشتیبان تهیه کرد. به‌طوری که فرایند کپی اطلاعات در کمترین زمان ممکن انجام شود. رویکرد فوق بیشتر از سوی دانشگاه‌ها و موسسات پژوهشی که تحقیقاتی انجام داده‌اند و نگران هستند اطلاعات به دلایل مختلف از دست برود استفاده می‌شود. علاوه بر این، هنگامی که سازمانی اطلاعات را تحلیل کرده و باید نسخه پشتیبان از اطلاعات تهیه کند از رویکرد همگام‌سازی استفاده می‌کند. در روش همگام‌سازی داده‌ها، بر مبنای نوع داده‌ها، محل ذخیره‌سازی، مکان‌هایی که اطلاعات باید از آن‌ها جمع‌آوری شود و موارد دیگر شناسایی شده و در ادامه همگام‌سازی انجام می‌شود.

تکثیر میزبان‌محور (Host-based): در رویکرد فوق برنامه‌های کاربردی ویژه‌ای در سرورها نصب می‌شود و اطلاعات سرور اصلی به سرور همگام‌سازی شده انتقال پیدا می‌کند. مزیت روش فوق این است که غیر هم‌زمان است و در نتیجه نیازی به پهنای باند بالا نیست. رویکرد فوق بیشتر برای آرشیو کردن اسناد و فایل‌های مهم استفاده می‌شود. در این روش یک کپی بی نقص از اطلاعات سرور گرفته می‌شود. البته این روش خالی از اشکال نیست، زیرا اگر پس از تکثیر تغییری در اطلاعات سرور به وجود آید تا فرایند تکثیر بعدی تنها یک کپی از اطلاعات در دسترس خواهد بود.

تکثیر شبکه‌محور (Network-based): در این روش نیازمند یک سوییچ با ظرفیت سوییچینگ بالا هستید. در این حالت سوییچ نقش واسطی را بازی می‌کند که اطلاعات را میان رسانه‌ ذخیره‌ساز و سرور انتقال می‌دهد. مزیتی که روش فوق دارد این است که به‌واسطه به‌کارگیری شبکه‌های محلی، سرعت بالایی در انتقال اطلاعات در اختیارتان قرار می‌دهد، اما در مقابل به سوییچی نیاز دارید که ظرفیت بالایی داشته باشد.

تکثیر آرایه‌محور (Array-based): از روش‌های تکثیر داده‌های هم‌زمان است. در این حالت داده‌ها به‌شکل خودکار تکثیر پیدا کرده و روی دیسک‌های سخت مختلفی قرار می‌گیرند. در روش مذکور اطلاعات به‌شکل هم‌زمان روی چند دیسک سخت با رید (RAID) مشخصی ذخیره‌سازی می‌شوند. عیب بزرگی که روش فوق دارد در همگام‌سازی خود دیسک‌های سخت است. به‌طوری که اگر یکی از دیسک‌های سخت بر مبنای معماری رید انتخاب شده با مشکل روبرو شد، ممکن است اطلاعات نسخه پشتیبان از دست بروند.

برای آشنایی با انواع رید میتوانید مقاله RAID چیست و معرفی انواع آن را مطالعه کنید.

تکثیر هایپروازیرمحور (Hypervisor-based): از این تکنیک به منظور تهیه نسخه پشتیبان از ماشین‌های مجازی استفاده می‌شود. به‌طوری که یک ماشین مجازی میزبانی شده روی سرور اصلی در یک سرور میزبان ثانویه کپی می‌شود. رویکرد فوق بیشتر از سوی ارایه‌دهندگان خدمات ابری دنبال می‌شود و مانع از آن می‌شود تا اطلاعات یک ماشین مجازی از دست برود، زیرا یک کپی از اطلاعات روی سرور دیگری قرار دارد. بزرگ‌ترین عیبی که روش فوق دارد در حجیم بودن آن است. با توجه به این‌که ماشین‌های مجازی به منابع سخت‌افزاری زیادی نیاز دارند، در عمل هر یک از نسخه‌های تهیه شده به فضای ذخیره‌سازی زیادی نیاز دارند.

 


انواع Data Replication

یکی از مهم‌ترین نکاتی که در ارتباط با تکثیر داده‌ها باید به آن دقت کنید حفظ اطلاعات برای شرایط ضروری است. به‌طور مثال، یک حمله هکری اتفاق افتاده و اطلاعات تحریف یا خراب شده‌اند. در این حالت با استفاده از یک کپی ضبط شده از اطلاعات این امکان وجود دارد تا در کمترین زمان ممکن همه چیز به حالت اولیه خود باز گردد. بر همین أساس باید از مکانیزمی متناسب با نیاز کاری و محدودیت‌های سازمان خود استفاده کنید. از روش‌های پر کاربرد در زمینه تکثیر باید به تکثیر داده‌های میزبان‌محور (Host-based)، تکثیر داده‌های هایپروایزرمحور (Hypervisor-based)، تکثیر داده‌های آرایه‌محور (Array-based) و تکثیر داده‌های شبکه‌محور (Network-based) اشاره کرد.

replication در شبکه

 

 

در مبحث تکثیر (replication) مبتنی بر شبکه به سوئیچ اضافی که قرار است میان آرایه‌های استوریج و سرورها قرار بگیرد نیاز دارید. این نوع تکثیر انعطاف‌پذیری زیادی داشته و سازگاری کامل با تمام پلتفرم‌های میزبانی دارد و قادر است از معماری RAIDهای مختلف پشتیبانی کند. تکثیر شبکه‌محور عمدتا در ارتباط با شبکه ذخیره‌سازی Storage Area Network (SAN)، شبکه محلیLocal Area Network (LAN) و شبکه گسترده Wide Area Network (WAN) استفاده می‌شود.

Replication در SQL Server

 

 

تکثیر در بانک اطلاعاتی اس‌کیو‌ال‌سرور موسوم به Replication در sql server برای کپی گرفتن از اطلاعات یک پایگ داده به پایگاه داده دیگری استفاده می‌شود. در این زمینه سرور اس‌کیو‌ال انعطاف‌پذیری خوبی داشته و به سرپرستان شبکه اجازه می‌دهد بر مبنای سه رویکرد مختلف اقدام به کپی گرفتن از اطلاعات کنند. هر یک از روش‌های مذکور مزایا و معایب خاص خود را دارد که به شرح زیر است:

SQL Server Snapshot Replication: ساده‌ترین روش تکثیر است که از طریق اسنپ شات انجام می‌شود. در این حالت یک کپی کامل از اطلاعات تهیه شده و در بازه‌های زمانی مختلف برای سرور یا ذخیره‌ساز ارسال می‌شود. از مزایای بالقوه روش فوق باید به زمان کم برای پیکربندی، عدم نیاز به کلید اصلی در جدول و استفاده ساده از آن اشاره کرد. با این‌حال، بزرگ‌ترین عیبی که روش فوق دارد، زمان تاخیر زیاد آن است.

برای آشنایی با Snapshot؛ مقاله اسنپ‌شات چیست و معرفی انواع آن و تفاوت Snapshot و بک‌آپ را مطالعه کنید.

SQL Server Transactional Replication: این روش بیشتر برای داده‌ها و تراکنش‌های با نرخ بالا مناسب است که باید تکثیر در بازه‌های زمانی کوتاه انجام شود. همچنین بیشتر در ارتباط با تجهیزاتی استفاده می‌شود که فاصله فیزیکی کمی با یکدیگر دارند. از معایب این تکنیک باید به پیکربندی نسبتا پیچیده، و زمان‌بر بودن و نگه‌داری نه چندان ساده اشاره کرد.

SQL Server Merge Replication:  این روش در مقایسه با نمونه‌های دیگر عملکرد خوبی دارد، با این‌حال، پیاده‌سازی زمان‌بر و نگهداری پیچیده از معایب آن هستند، در نقطه مقابل، امکان به‌روزرسانی رکوردها و انجام تغییرات به‌شکل آفلاین از مزایای بالقوه آن به شمار می‌روند.

نکته‌ای که باید در ارتباط با replication در sql server به آن دقت کنید، انواع replication در دسترس است. به‌طور معمول سرپرستان شبکه می‌توانند از روش رونوشت تراکنش (Transactional Replication)، رونوشت ادغامی (Merge Replication) و رونوشت ثبت لحظه‌ای (Snapshot replication) استفاده کنند. همانند مواردی که ابتدای مقاله به آن اشاره شد، نوع تکثیر در این زمینه به معیارهای عملکردی و محدودیت‌های سازمانی بستگی دارد. محیط فیزیکی replication، نوع و کمیت داده‌هایی که قصد تکثیر آن‌ها را داریم و این مسئله که آیا داده‌ها باید برای مشترکان به‌روز‌رسانی شوند یا خیر از جمله این محدودیت‌ها هستند.

پست های مرتبط