Apa yang perlu saya lakukan sekiranya ECS pelayan Alibaba Cloud dimatikan? Panduan untuk snapshot, pencerminan, dan migrasi dan pemulihan merentas kawasan yang boleh digunakan

2026-05-07 阅读 23
1

Dalam operasi dan penyelenggaraan pengkomputeran awan yang sebenarnya, walaupun platform awan mempunyai kestabilan yang sangat tinggi, "gangguan zon tunggal (AZ)" yang disebabkan oleh force majeure seperti gempa bumi dan kegagalan kuasa masih merupakan risiko yang mesti dipertimbangkan dalam reka bentuk seni bina. Untuk perniagaan yang belum menggunakan "kehidupan berganda di kota yang sama" atau "kehidupan berganda di tempat yang berbeza" kerana pertimbangan kos, menguasai satu set

Sandaran data pantas dan migrasi merentas kawasan yang boleh digunakan

Pelan kecemasan adalah barisan pertahanan terakhir untuk memastikan kesinambungan perniagaan.

Artikel ini akan menyusun penyelesaian teknikal pemulihan perniagaan berdasarkan snapshot, pencerminan dan platform migrasi SMC untuk anda.

1. Senario pemulihan bencana teras dan kaedah teknikal

Untuk kedalaman kesalahan yang berbeza, kami biasanya menggunakan strategi pemulihan tiga dimensi berikut:

Strategi pemulihan

Prinsip teknikal

Senario yang sesuai

Mengimbas kembali data cakera awan

Berdasarkan snapshot ECS. Pulihkan ke titik waktu tertentu dengan mengembalikan snapshot atau memasang cakera baru yang dibuat dengan memasang snapshot.

Data dihapus secara tidak sengaja, menemui ransomware, dan kesalahan logik pangkalan data.

Pembinaan semula persekitaran sistem

Berdasarkan cermin tersuai. Kemas contoh sepenuhnya untuk memulihkan sistem operasi dan persekitaran yang telah dipasang sebelumnya dengan cepat.

Sistem rosak, konfigurasi rosak, dan persekitaran operasi yang sama persis memerlukan pengklonan kumpulan.

Terjemahan merentasi zon yang ada

Terima kasih kepada SMC (Pusat Migrasi). Salin contoh dan sumber yang berkaitan secara keseluruhan ke kawasan lain yang ada di kawasan yang sama.

Melarikan diri secara keseluruhan apabila kegagalan fizikal (seperti kegagalan kuasa, gangguan rangkaian) berlaku di seluruh kawasan yang ada.

2. Pilihan 1: Pemulihan data tahap cakera awan (teknologi snapshot)

Snapshot adalah kaedah perlindungan data yang paling asas dan cekap di awan.

1. Strategi sandaran

Sandaran manual: Sebelum kemas kini sistem utama atau pelepasan aplikasi, buat gambar secara manual untuk cakera sistem dan cakera data.

Sandaran strategi: Melalui "strategi snapshot automatik", konfigurasikan kitaran penyimpanan (seperti sandaran pagi setiap hari, simpan selama 7 hari) untuk mewujudkan sandaran tanpa pengawasan.

Cadangan kumpulan: Gunakan penjadualan operasi dan penyelenggaraan (OOS) untuk mengambil gambar beratus-ratus kes pada masa yang sama dengan satu klik.

2. Pulihkan pertempuran sebenar

Roll in-situ: Jika contoh masih ada, jalankan "Cloud Disk Roll" secara langsung, dan data akan dipulihkan ke titik snapshot dengan serta-merta.

Pemasangan merentas kawasan: Sekiranya kawasan A yang ada sekarang tidak dapat digunakan, anda boleh menggunakan tangkapan gambar untuk membuat cakera awan baru di kawasan yang ada B, dan memasangnya ke contoh baru kawasan B untuk mewujudkan pengekstrakan data di luar lokasi.

3. Penyelesaian 2: Pemulihan satu kekunci tahap persekitaran (teknologi pencerminan)

Cermin tidak hanya mengandungi data, tetapi juga konfigurasi sistem operasi, pemboleh ubah persekitaran dan kebenaran perisian.

Penciptaan cermin: Sebaiknya buat "cermin tersuai" melalui contoh segera setelah permulaan persekitaran perniagaan selesai.

Pengklonan persekitaran: Apabila sistem contoh asal tidak dapat dimulakan kerana pencerobohan haram atau pencemaran alam sekitar, gunakan cermin untuk membeli semula contoh untuk memastikan "di luar kotak" tanpa memasang semula perisian.

Penyebaran merentas wilayah: Cermin khusus adalah sumber peringkat wilayah, yang secara langsung dapat menarik contoh baru di mana-mana kawasan yang ada di kawasan yang sama.

4. Pilihan 3: Melarikan diri secara keseluruhan (SMC berhijrah melintasi zon yang boleh digunakan)

Apabila kawasan yang tersedia mengesahkan bahawa kegagalan kawasan besar telah berlaku dan tidak dapat dipulihkan dalam jangka pendek, gunakan Pusat Migrasi Pelayan (SMC)

Penghijrahan keseluruhan adalah laluan terbaik.

1. Prinsip penghijrahan

SMC akan memanggil keupayaan replikasi merentas kawasan penyimpanan blok yang mendasari. Ia bukan sahaja memindahkan data, tetapi juga menyegerakkan ciri-ciri spesifikasi contoh.

2. Proses penghijrahan

Penyediaan persekitaran: Sahkan bahawa kawasan tersedia sasaran mempunyai sumber yang mencukupi (vCPU, bahagian memori), dan buka perkhidmatan pelesenan RAM dan snapshot.

Buat tugas: pilih "Migrasi merentasi zon tersedia" pada konsol SMC, tentukan zon tersedia sasaran dan suis baru (VPC).

Peralihan lancar: SMC secara automatik melengkapkan penyegerakan data penyimpanan blok belakang. Catatan: Penghijrahan akan menyebabkan contoh dimulakan semula, dan IP peribadi akan berubah. Pastikan kod aplikasi atau load balancing (SLB) anda terikat dengan nama domain dinamik dan bukannya alamat mati.

5. Latihan kesalahan: Bagaimana mengesahkan keberkesanan pemulihan bencana?

"Rancangan pemulihan bencana yang belum dipraktikkan adalah rancangan palsu." Ujian simulasi berikut disyorkan secara berkala:

Latih tubi kerosakan cakera awan: Padamkan sebahagian data secara manual, dan uji masa (RTO) yang diperlukan untuk menggulung kembali ke keadaan 100% melalui gambar.

Latihan anomali persekitaran: Fail inti sistem simulasi rosak, dan sistem dipasang semula melalui pencerminan untuk mengesahkan sama ada perniagaan dapat ditarik secara automatik.

Pelarian simulasi SMC: Lakukan migrasi merentas kawasan yang boleh digunakan semasa tempoh puncak perniagaan rendah, catat kesan perubahan IP rangkaian awam/swasta pada perniagaan hulu dan hilir, dan optimalkan proses pertukaran.

Ringkasan

Untuk perniagaan dengan keperluan pemulihan bencana yang rendah atau sensitif terhadap kos, "sandaran kitaran tangkapan gambar, sandaran persekitaran cermin, migrasi kecemasan SMC" adalah penyelesaian yang paling menjimatkan. Ia tidak memerlukan anda membayar dua kali ganda kos operasi pelayan, tetapi dapat memberikan kaedah pemulihan perniagaan yang boleh dipercayai pada masa krisis.

cloud
← 返回新闻中心