Tidak takut bilik komputer terbakar? Vernakular melalui Alibaba Cloud load balancing SLB mempunyai tahap ketahanan bencana yang tinggi

2026-05-26 阅读 16
1

Ketika berbicara mengenai seni bina ketersediaan tinggi, banyak saudara mempunyai salah faham, berfikir: "Saya mempunyai 10 pelayan belakang, dan pangkalan data juga mempunyai master dan sandaran, dan seni bina saya stabil seperti gunung."

Tetapi pernahkah anda berfikir bahawa di hadapan 10 pelayan ini

Bagaimana jika "memimpin pesta"-load balancing (SLB) digantung? Tidak kira seberapa kuat ECS belakang anda, lalu lintas pengguna bahkan tidak dapat memasuki pintu, dan seluruh sistem lumpuh seketika. Ini adalah kegagalan titik tunggal biasa (SPOF)

Sebagai "pintu utama" keseluruhan lalu lintas rangkaian, bagaimana SLB pengimbangan beban Alibaba Cloud (kini dibahagikan kepada CLB tradisional dan ALB terapan) dapat mencapai bahawa walaupun bilik komputer terbakar dan jaringan tulang belakang terputus, ia masih dapat diteruskan dengan stabil seperti anjing lama Lalu lintas? Hari ini kita tidak membincangkan perkara-perkara maya itu, buka langsung tudung dan lihat casisnya yang boleh digunakan.

1. Lapisan pertama perisai menyelamatkan nyawa: mekanisme "tayar ganti" di seluruh zon (zon)

Sekiranya anda membeli SLB di latar belakang Alibaba Cloud, anda akan mendapati bahawa sistem ini pasti akan membolehkan anda memilih dua perkara:

Kawasan tersedia utama (Zon Utama)

Dan

Zon Bersedia

。 Contohnya: Kawasan tersedia Beijing A, dan kawasan tersedia Beijing B.

Ini adalah seni bina ketersediaan tinggi yang paling asas dan teras di seluruh bilik komputer SLB.

Keadaan biasa (utama dan siap sedia): SLB sebenarnya memulakan sekurang-kurangnya dua set contoh perkakasan atau mesin maya untuk anda di ruang komputer yang mendasari. Biasanya, semua lalu lintas adalah 100% contoh SLB dari kawasan tersedia utama A. Contoh zon sandaran B berada dalam keadaan "sandaran panas", sama seperti tayar ganti kereta, sambil mengikuti dan menonton dengan senyap.

Keadaan yang melampau (beralih dalam beberapa saat): Andaikan bahawa ruang komputer di Kawasan Tersedia Beijing A tiba-tiba terputus, atau kabel optik terputus. Sistem pemeriksaan kesihatan yang mendasari Alibaba Cloud akan bertindak balas dalam masa 2-5 saat, secara langsung mengalihkan IP maya (VIP) nama domain ke contoh SLB di kawasan sandaran B.

Persepsi pengguna: Permintaan rangkaian pengguna mungkin berkelip kerana pemutusan dan penyambungan semula, tetapi akses normal dapat dipulihkan dengan segera. Anda tidak perlu mengubah resolusi DNS, dan anda tidak perlu beralih secara manual ke titik latar belakang. Lapisan bawah sepenuhnya automatik.

2. Tahap kedua serangan penurunan dimensi: pemulihan bencana yang lancar antara kelompok berskala ultra besar dan Anycast

"Bagaimana jika dua kawasan yang ada di kawasan tertentu digantung pada waktu yang sama?" (Walaupun kebarangkalian sangat rendah, peningkatan teknikal adalah tradisi operasi dan penyelenggaraan yang baik).

Pada masa ini, ia bergantung pada reka bentuk kluster di bahagian atas SLB. SLB Alibaba Cloud bukan pelayan tunggal yang bertarung, di belakangnya adalah besar

LVS (empat lapisan) + Tenine (tujuh lapisan)

Kluster fizikal.

Dalam pengimbangan beban empat lapisan (CLB), Alibaba Cloud menggunakan

Anycast BGP (Siaran sewenang-wenangnya)

Teknologi:

Alibaba Cloud membenarkan beberapa bilik komputer teras di seluruh dunia untuk mengumumkan SLB yang sama pada masa yang sama di rangkaian tulang belakang

Alamat IP rangkaian awam.

Pada saat lalu lintas pengguna memasuki rangkaian Alibaba Cloud, penghala BGP pengendali secara automatik ditugaskan ke kluster SLB terdekat dan paling sihat mengikut "keadaan kesesakan" rangkaian.

Sekiranya kluster SLB di salah satu ruang komputer merokok secara keseluruhan, protokol penghalaan BGP secara automatik akan "memutar" lalu lintas ke kluster SLB di bandar lain dalam beberapa saat. Struktur "multi-aktif" ini telah melampaui batasan satu wilayah.

3. Lapisan pertahanan mikro ketiga: "panggilan hidup dan mati" SLB ke ECS belakang

Kekurangan tinggi SLB itu sendiri tidak mencukupi, ia juga mesti memastikan bahawa pelayan yang diedarkan pada masa lalu juga hidup. Ini melibatkan

Pemeriksaan Kesihatan (Health Check)

Banyak pemula mengkonfigurasi pemeriksaan kesihatan secara rawak, yang mengakibatkan "kesan longsoran". Pemeriksaan kesihatan SLB membantu anda menyelamatkan nyawa anda:

Panggilan empat tingkat (TCP): SLB seperti mesin kad waktu yang kejam, berjabat tangan dengan port ECS belakang anda (seperti port 80) setiap beberapa saat. Sekiranya jabat tangan berjaya, ini bermakna anda masih hidup; jika jabat tangan gagal 3 kali berturut-turut, SLB akan mengusir anda dari barisan dalam milisaat. Trafik baru sama sekali tidak diperuntukkan kepada anda.

Pemeriksaan fizikal mendalam tujuh lapisan (HTTP): Dalam banyak kes, port disambungkan, tetapi kod belakang tersekat (seperti membuang 500 ralat). Pada masa ini, SLB akan mensimulasikan penyemak imbas untuk mengakses URL yang anda tentukan (mis. health.html). Sekiranya kod status yang dikembalikan bukan 2xx atau 3xx, tarik terus pelayan ini.

Penyembuhan diri dari kesalahan: Setelah ECS anda dimulakan semula dan kodnya kembali normal, SLB secara automatik akan menariknya kembali ke barisan untuk terus bekerja setelah lulus pemeriksaan fizikal. Campur tangan manual sifar dalam keseluruhan proses.

4. Panduan untuk mengelakkan lubang dalam pertempuran sebenar: Bagaimana kita tidak boleh menjadi ganas?

Alibaba Cloud telah mencapai tahap ketersediaan SLB yang tinggi, tetapi jika anda bodoh dalam konfigurasi, set ketersediaan tinggi ini tidak akan berguna. Pastikan anda ingat tiga undang-undang besi berikut:

1. ECS belakang mesti digunakan di seluruh kawasan yang tersedia

Ini adalah kesilapan yang paling biasa! Ramai orang membeli SLB (kawasan utama A, kawasan persiapan B) yang melintasi kawasan yang tersedia, tetapi untuk kemudahan gambar, mereka membeli semua 4 ECS di bahagian belakang di kawasan yang tersedia A.

Akibatnya, setelah zon A yang tersedia dimatikan, SLB berjaya beralih ke zon sandaran B, tetapi SLB zon sandaran B melihat ke belakang-kosong dan tidak ada pelayan. Tinggi boleh digunakan untuk memecahkan kuasa secara langsung.

Postur yang betul: SLB melintasi zon A/B, dan ECS di hujung belakang juga harus diedarkan secara merata di zon A/B.

2. Adakah "Sesi Tetap" mesti dihidupkan?

Sekiranya perniagaan anda memerlukan pengguna untuk log masuk (status disimpan dalam memori pelayan), sesi pembukaan dapat terus menghantar permintaan pengguna yang sama ke ECS yang sama.

Tetapi! Sekiranya EC tertentu

Sekiranya S mati, sesi pengguna ini pasti akan terputus. Untuk ketersediaan yang sangat tinggi,

Sangat disarankan untuk menanggalkan Sesi dan memasukkannya ke dalam cache Redis (seperti versi Alibaba Cloud Redis)

, Biarkan ECS belakang menjadi "tidak bernegara". Dengan cara ini, jika ada ECS yang mati secara tiba-tiba, SLB dapat memotong lalu lintas ke pelayan lain dengan lancar, dan pengguna sama sekali tidak sensitif.

3. Tetapkan TTL dan ambang pemeriksaan kesihatan dengan munasabah

Jangan tetapkan selang waktu untuk pemeriksaan kesihatan terlalu lama (misalnya, periksa sekali setiap 10 saat, dan sahkan setelah 5 kegagalan berturut-turut, yang bermaksud bahawa pelayan akan ditutup selama hampir satu minit untuk mengetahui, dan sebilangan besar pengguna akan melaporkan kesalahan dalam satu minit); tetapi juga Jangan tetapkan terlalu agresif (contohnya, periksa sekali setiap 1 saat), jika tidak, pada masa yang tinggi, lalu lintas pemeriksaan kesihatan itu sendiri akan menghancurkan pelayan anda.

Cadangan emas: Masa tindak balas adalah 3 saat, selang pemeriksaan adalah 2-3 saat, ambang tidak sihat adalah 3 kali, dan ambang kesihatan adalah 2 kali.

Ringkasan

Ketersediaan tinggi Alibaba Cloud SLB adalah satu set

Perutean BGP global, ke perkakasan utama dan siap sedia di seluruh ruang komputer, dan kemudian ke pemeriksaan kesihatan tahap kedua pelayan belakang

Sistem pertahanan tiga dimensi.

Untuk operasi dan penyelenggaraan dan arkitek, SLB adalah komponen yang paling menjimatkan dalam keseluruhan sistem. Anda tidak perlu mengkaji bagaimana memperuntukkan Keepalived yang kompleks, bagaimana menggerakkan IP maya, bagaimana mengekalkan kluster LVS, dan menghabiskan sedikit wang dalam sebulan, anda secara langsung dapat menikmati gerbang anti-bencana yang dilatih oleh arkitek teratas pengeluar utama. Berikan perkara profesional kepada SLB. Satu-satunya perkara yang perlu anda lakukan ialah membahagikan pelayan belakang dengan jujur ke dalam bilik komputer yang berbeza.

1
← 返回新闻中心