ماذا أفعل إذا توقف خادم Alibaba Cloud ECS ؟ لقطة ومرآة واستراتيجية كاملة لاستعادة الهجرة عبر المناطق المتاحة
في التشغيل الفعلي والصيانة للحوسبة السحابية ، على الرغم من أن النظام الأساسي السحابي يتمتع باستقرار عالٍ للغاية ، إلا أن "انقطاع المنطقة القابلة للاستخدام (AZ)" الناجم عن القوة القاهرة مثل الزلازل وفشل الطاقة لا يزال يمثل خطرًا يجب مراعاته في التصميم المعماري. بالنسبة للشركات التي لم تنشر "العيش المزدوج في نفس المدينة" أو "العمل في أماكن مختلفة" لاعتبارات التكلفة ، إتقان مجموعة واحدة
النسخ الاحتياطي السريع للبيانات مع الترحيل عبر المناطق المتاحة
خطة الطوارئ هي خط الدفاع الأخير لضمان استمرارية الأعمال.
ستقوم هذه المقالة بتمشيط حلول تقنية استعادة الأعمال استنادًا إلى اللقطات والنسخ المتطابق ومنصات ترحيل SMC.
1. مشاهد الكوارث الأساسية والوسائل التقنية
بالنسبة لعمق الخطأ المختلف ، عادة ما نعتمد استراتيجية الاسترداد للأبعاد الثلاثة التالية:
استراتيجية الانتعاش
مبادئ التكنولوجيا
حالات الاستخدام
تراجع بيانات القرص السحابي
استنادًا إلى لقطة ECS. يتم استعادة القرص الجديد الذي تم إنشاؤه عن طريق التراجع عن اللقطات أو تثبيت اللقطات إلى نقطة زمنية محددة.
تم حذف البيانات عن طريق الخطأ ، وواجهت فيروسات الابتزاز ، وأخطاء منطق قاعدة البيانات.
إعادة بناء بيئة النظام
بناء على مرآة مخصصة. قم بتعبئة المثيل بالكامل ، واستعادة نظام التشغيل بسرعة والبيئة المثبتة مسبقًا.
تعطل النظام ، وتلف التكوين ، والحاجة إلى استنساخ الدُفعات لبيئة تشغيل متسقة تمامًا.
الترجمة عبر المناطق المتاحة
مع SMC (مركز الهجرة). يتم نسخ الأمثلة والموارد المرتبطة بها ككل إلى المناطق الأخرى المتاحة في نفس المنطقة الجغرافية.
الهروب العام في حالة حدوث عطل مادي (مثل انقطاع التيار الكهربائي وانقطاع الشبكة) في جميع أنحاء المنطقة المتاحة.
2. الخيار 1: استعادة البيانات على مستوى القرص السحابي (تقنية اللقطة)
اللقطة هي الطريقة الأساسية والأكثر كفاءة لحماية البيانات على السحابة.
1-استراتيجية النسخ الاحتياطي
النسخ الاحتياطي اليدوي: قم بإنشاء لقطات يدويًا لأقراص النظام وأقراص البيانات قبل إجراء تحديثات النظام الرئيسية أو إصدار التطبيقات.
النسخ الاحتياطي الاستراتيجي: من خلال "استراتيجية اللقطة التلقائية" ، قم بتكوين دورة الاحتفاظ (مثل النسخ الاحتياطي في الصباح الباكر كل يوم ، والاحتفاظ بها لمدة 7 أيام) لتحقيق النسخ الاحتياطي غير المأهول.
النسخ الاحتياطي الدُفعات: باستخدام تخطيط التشغيل والصيانة (OOS) ، يتم التقاط مئات الأمثلة في نفس الوقت بنقرة واحدة.
2. استئناف القتال الفعلي
التراجع في الموقع: إذا كان المثال لا يزال هناك ، قم بتنفيذ "تراجع القرص السحابي" مباشرة ، وعادت البيانات إلى نقطة اللقطة على الفور.
التحميل عبر المناطق: إذا كانت المنطقة المتاحة حاليًا A غير متوفرة ، فيمكنك استخدام اللقطة لإنشاء قرص سحابي جديد في المنطقة القابلة للاستخدام B ، ثم تحميلها على مثيلات جديدة في المنطقة B لتحقيق استخراج البيانات خارج الموقع.
3. الخيار 2: استعادة بنقرة واحدة على المستوى البيئي (تقنية المرآة)
لا تحتوي المرآة على البيانات فحسب ، بل تحتوي أيضًا على تكوين نظام التشغيل ومتغيرات البيئة وترخيص البرامج.
إنشاء المرآة: يوصى بإنشاء "مرآة مخصصة" من خلال مثيل بمجرد اكتمال تهيئة بيئة العمل.
الاستنساخ البيئي: عندما يتعذر بدء تشغيل نظام المثيل الأصلي بسبب الغزو غير القانوني أو التلوث البيئي ، يمكن أن يضمن استخدام المرآة لإعادة شراء المثيل "خارج الصندوق" دون الحاجة إلى إعادة تثبيت البرنامج.
النشر عبر المناطق: المرآة المخصصة هي مورد على المستوى الإقليمي ، ويمكن سحب أمثلة جديدة مباشرة في أي منطقة متاحة تحت نفس المنطقة.
4. الخيار 3: الهروب الشامل (نقل SMC عبر المناطق المتاحة)
عندما تؤكد منطقة قابلة للاستخدام حدوث عطل واسع النطاق ولا يمكن استردادها على المدى القصير ، استخدم مركز ترحيل الخادم (SMC)
الهجرة الشاملة هي أفضل مسار.
1. مبدأ الهجرة
سيتصل SMC بقدرة النسخ المتماثل عبر المناطق لتخزين الكتلة الأساسية. لا يقوم بترحيل البيانات فحسب ، بل يقوم أيضًا بمزامنة خصائص مواصفات المثيل.
2-عملية الترحيل
الإعداد البيئي: تأكد من وجود موارد كافية (vCPU ، حصة الذاكرة) في المنطقة المتاحة للهدف ، وفتح خدمات ترخيص ذاكرة الوصول العشوائي واللقطات.
إنشاء المهام: حدد "الترحيل عبر المناطق المتاحة" في وحدة تحكم SMC ، وحدد منطقة الوصول المستهدفة والمفاتيح الجديدة (VPC).
التبديل السلس: يكمل SMC تلقائيًا مزامنة بيانات تخزين الكتلة في النهاية الخلفية. ملاحظة: يؤدي الترحيل إلى إعادة تشغيل المثيل وتغيير عنوان IP الخاص. تأكد من أن رمز التطبيق أو موازنة التحميل (SLB) مرتبط بنطاق ديناميكي بدلاً من العنوان الميت.
5. تمرين الخطأ: كيفية التحقق من فعالية القدرة على تحمل الكوارث ؟
"خطط التعافي من الكوارث التي لم يتم ممارستها كلها خطط مزيفة." يوصى بإجراء اختبارات المحاكاة التالية بانتظام:
تمرين تلف القرص السحابي: قم بحذف جزء من البيانات يدويًا واختبر الوقت (RTO) اللازم للعودة إلى حالة 100 ٪ من خلال لقطة.
تمرين الشذوذ البيئي: الملف الأساسي لنظام المحاكاة تالف ، ومن خلال إعادة تثبيت المرآة ، تحقق مما إذا كان يمكن سحب العمل تلقائيًا.
الهروب التناظري SMC: قم بتنفيذ عملية نقل عبر المناطق المتاحة خلال فترة العمل المنخفضة ، وتسجيل تأثير تغييرات IP للشبكة العامة/الخاصة على خدمات المنبع والمصب ، وتحسين عملية التبديل.
الخلاصة
بالنسبة للشركات ذات المتطلبات المنخفضة للاستجابة للكوارث أو الحساسة من حيث التكلفة ، فإن "النسخ الاحتياطي لدورة اللقطة ، النسخ الاحتياطي لبيئة النسخ المتطابق ، الترحيل الطارئ SMC" هو الحل الأكثر فعالية من حيث التكلفة. لا يتطلب منك دفع ضعف رسوم تشغيل الخادم ، ولكنه يوفر وسيلة موثوقة لاستعادة الأعمال في أوقات الأزمات.

