هل أنت خائف من الحريق في غرفة الكمبيوتر ؟ اللغة العامية الكبيرة من خلال موازنة تحميل سحابة علي

2026-05-26 阅读 15
cloud

عند الحديث عن البنية المتاحة ، كان لدى العديد من الإخوة سوء فهم ، وشعروا: "لدي 10 خوادم خلفية ، كما أن قاعدة البيانات جاهزة ، وهندسي مستقر مثل جبل تاي."

ولكن هل سبق لك أن فكرت أن هذه الخوادم 10 في المقدمة

ماذا لو تم تعليق "حزب الطريق"-موازنة التحميل (SLB) ؟ بغض النظر عن مدى قوة ECS في النهاية الخلفية ، لا يمكن لحركة مرور المستخدم حتى دخول الباب ، ويصاب النظام بأكمله بالشلل على الفور. هذا هو الخطأ النموذجي في نقطة واحدة (SPOF)

.

باعتبارها "البوابة الرئيسية" لحركة مرور الشبكة بأكملها ، كيف يمكن أن يكون توازن تحميل Alibun SLB (الآن مقسم إلى CLB التقليدي و ALB التطبيق) مستقرًا مثل الكلب القديم. اليوم ، نحن لا نسحب هؤلاء الوهميين ، ونسحب غطاء المحرك مباشرة وننظر إلى هيكلها العالي القابل للاستخدام.

1. الدرع الأول لإنقاذ الحياة: آلية "الإطار الاحتياطي" عبر المنطقة القابلة للاستخدام

إذا قمت بشراء SLB في خلفية Alibaba Cloud ، فستجد أن النظام سيجعلك بالتأكيد تختار شيئين:

المنطقة الرئيسية المتاحة (Primary Zone)

و

المنطقة الاحتياطية (Backup Zone)

. على سبيل المثال: المنطقة القابلة للاستخدام في بكين A ، والمنطقة القابلة للاستخدام في بكين B.

هذه هي البنية الأساسية والأساسية عبر غرفة الكمبيوتر عالية الاستخدام لـ SLB.

الحالة المعتادة (الإعداد الرئيسي واضح): يقوم SLB بالفعل بتنشيط مجموعتين على الأقل من مثيلات الأجهزة أو الأجهزة الافتراضية لك في غرفة الكمبيوتر الأساسية. جميع حركة المرور المعتادة هي 100 ٪ من مثيلات SLB في المنطقة الرئيسية القابلة للاستخدام A. مثال المنطقة الاحتياطية B في حالة "الاستعداد الساخن" ، تمامًا مثل الإطارات الاحتياطية للسيارة ، وهي تراقب بصمت أثناء الدوران.

الحالة القصوى (تبديل الثواني): لنفترض أن غرفة الكمبيوتر في المنطقة المتاحة A في بكين قد انقطعت فجأة أو تم قطع الكابل البصري. سيتفاعل نظام الفحص الصحي الأساسي لـ Alibaba Cloud في غضون 2-5 ثوانٍ ، حيث ينجرف IP الافتراضي (VIP) لاسم المجال مباشرة إلى مثيلات SLB في المنطقة الاحتياطية B.

إدراك المستخدم: قد تومض طلبات شبكة المستخدم بسبب إعادة الاتصال ، ولكن يمكن استعادة الوصول العادي على الفور. لا تحتاج إلى تعديل أي تحليل DNS ، ولا تحتاج إلى التبديل يدويًا إلى نقطة الخلفية ، الطبقة السفلية مؤتمتة بالكامل.

2. ضربة خفض المستوى الثاني: القدرة السلسة للتجمعات الضخمة و Anycast

"ماذا لو تم تعليق المنطقتين المتاحتين في منطقة معينة في نفس الوقت ؟" (على الرغم من أن الاحتمال منخفض للغاية ، إلا أن الرفع الفني هو تقليد ممتاز في التشغيل والصيانة).

في هذا الوقت ، يعتمد ذلك على تصميم الكتلة للطبقة العليا من SLB. Alibaba Cloud's SLB ليس خادمًا واحدًا في المعركة ، وخلفه ضخم

LVS (أربعة طوابق) + Tengine (سبعة طوابق)

مجموعات الفيزياء.

في توازن التحميل المكون من أربع طبقات (CLB) ، اعتمدت Alibaba Cloud

Anycast BGP (البث التعسفي)

التكنولوجيا:

علي يون على الشبكة الأساسية ، دع العديد من غرف الكمبيوتر الأساسية حول العالم تعلن عن نفس SLB في نفس الوقت

عنوان IP العام.

في اللحظة التي تدخل فيها حركة مرور المستخدم إلى شبكة Alibaba Cloud ، يتم تخصيص جهاز توجيه BGP الخاص بالمشغل تلقائيًا إلى أقرب مجموعة SLB وأكثرها صحة وفقًا لـ "الازدحام" لطريق الشبكة.

إذا كانت مجموعة SLB في إحدى غرف الكمبيوتر تدخن ككل ، فإن بروتوكول توجيه BGP سيرسل تلقائيًا حركة المرور إلى مجموعة SLB في مدينة أخرى في غضون ثوانٍ قليلة. لقد تجاوز هذا الهيكل "متعدد المعيشة" قيود المنطقة الواحدة.

3. خط الدفاع الصغير الثالث: SLB "اسم الحياة والموت" لـ ECS الخلفي

لا يكفي أن يكون SLB متاحًا بشكل كبير ، بل يجب أن يضمن أيضًا أن توزيعه للخوادم السابقة على قيد الحياة أيضًا. هذا ينطوي على

الفحص الصحي (Health Check)

.

قام العديد من المبتدئين بتكوين فحوصات صحية بشكل عشوائي ، مما أدى إلى "تأثير الانهيار الجليدي". الفحص الصحي لـ SLB هو ما يساعدك على الحفاظ على حياتك:

الاتصال بالطابق الرابع (TCP): SLB يشبه آلة لكمة لا هوادة فيها ، تصافح منفذ ECS الخلفي (مثل 80 منفذًا) كل بضع ثوانٍ. إذا نجحت المصافحة ، فهذا يعني أنك على قيد الحياة ؛ إذا فشلت 3 مصافحة متتالية ، فسوف يطردك SLB من قائمة الانتظار في غضون ميلي ثانية. بالتأكيد لن يتم توزيع حركة المرور الجديدة لك.

الفحص البدني العميق المكون من سبع طبقات (HTTP): في كثير من الأحيان يكون المنفذ متصلاً ، لكن الكود الخلفي عالق (مثل إلقاء خطأ 500). في هذا الوقت ، سيقوم SLB بمحاكاة المتصفح للوصول إلى عنوان URL المحدد (مثل/health.html). إذا لم يكن رمز الحالة الذي تم إرجاعه 2xx أو 3xx ، فاسحب الخادم مباشرة.

الشفاء الذاتي للفشل: بمجرد إعادة تشغيل ECS الخاص بك ، يعود الرمز إلى طبيعته. بعد إعادة فحص SLB ، سيتم سحبه تلقائيًا إلى قائمة الانتظار لمواصلة العمل. لا تدخل يدوي في جميع أنحاء العملية.

رابعًا ، دليل تجنب الحفر في القتال الفعلي: كيف لا يمكننا تدمير الأشياء السماوية العنيفة ؟

لقد حقق Alibaba Cloud أقصى استخدام لـ SLB ، ولكن إذا كنت غبيًا في التكوين ، فإن هذه المجموعة العالية ستكون عديمة الفائدة. تأكد من تذكر القوانين الحديدية الثلاثة التالية:

1. يجب نشر ECS الخلفية عبر المناطق المتاحة

هذا هو الخطأ الأكثر شيوعا! اشترى العديد من الأشخاص SLB عبر المنطقة القابلة للاستخدام (المنطقة الرئيسية A ، المنطقة الاحتياطية B) ، ولكن من أجل راحة الصورة ، قاموا بشراء جميع ECS الأربعة في النهاية الخلفية في المنطقة القابلة للاستخدام A.

نتيجة لذلك ، بمجرد انقطاع التيار الكهربائي عن المنطقة القابلة للاستخدام A ، تحولت SLB بنجاح إلى المنطقة الاحتياطية B ، لكن SLB لمنطقة الاحتياطي B تبدو فارغة ، ولا يوجد خادم. يمكن استخدام Gao لكسر العمل مباشرة.

الموقف الصحيح: يمتد SLB إلى منطقة A/B ، ويجب أيضًا توزيع ECS في النهاية الخلفية بالتساوي في منطقة A/B.

2. هل يجب تشغيل "Session Stickiness" ؟

إذا كان نشاطك التجاري يتطلب تسجيل دخول المستخدم (يتم حفظ الحالة في ذاكرة الخادم) ، فافتح الجلسة واترك طلب نفس المستخدم يتم إرساله إلى نفس ECS طوال الوقت.

لكن! إذا كان هناك EC

توقف S ، وستقطع جلسة المستخدم حتمًا. من أجل توافر عالية حقا ،

يوصى بشدة بتجريد Session ووضعه في ذاكرة التخزين المؤقت لـ Redis (مثل إصدار Alibun Redis)

، دع ECS في النهاية الخلفية تصبح "بلا حالة". بهذه الطريقة ، إذا مات أي ECS ، يمكن لـ SLB قطع حركة المرور بسلاسة إلى الخوادم الأخرى ، ولا يشعر المستخدمون بذلك تمامًا.

3. تحديد عتبة TTL والفحص الصحي بشكل معقول

لا ينبغي أن تكون الفترة الفاصلة بين الفحوصات الصحية طويلة جدًا (على سبيل المثال ، يتم فحصها مرة واحدة كل 10 ثوانٍ ، ويتم تأكيدها فقط بعد 5 إخفاقات متتالية ، مما يعني أنه سيتم العثور على SLB بعد تعليق الخادم لمدة دقيقة تقريبًا ، وسيكون هناك عدد كبير من المستخدمين للإبلاغ عن الأخطاء في هذه الدقيقة) ؛ ولكن لا تقم بضمها بشكل جذري (مثل التحقق مرة واحدة في الثانية) ، خلاف ذلك ، في التزامن العالي ، سوف تسحق حركة المرور من الفحص الصحي نفسه الخادم الخاص بك.

التوصية الذهبية: 3 ثوانٍ إضافية استجابة ، وفصل الفحص 2-3 ثوانٍ ، وعتبة غير صحية 3 مرات ، وعتبة صحية 2 مرات.

الخلاصة

علي سحابة SLB عالية المتاحة ، هي مجموعة من

طريق BGP العالمي ، إلى الأجهزة الرئيسية عبر غرفة الكمبيوتر ، ثم إلى الفحص الصحي الثاني للخادم الخلفي

نظام الدفاع ثلاثي الأبعاد.

بالنسبة لعمال الصيانة والمهندسين المعماريين ، يعد SLB المكون الأكثر فعالية من حيث التكلفة في النظام بأكمله. لا تحتاج إلى دراسة كيفية مطابقة Keepalived المعقدة ، وكيفية انجراف IP الافتراضي ، وكيفية الحفاظ على مجموعة LVS ، وقضاء القليل من المال في الشهر ، يمكنك الاستمتاع مباشرة بالبوابة المقاومة للكوارث التي يدرسها كبار المهندسين المعماريين في المصانع الكبرى. لتسليم الأشياء المهنية إلى SLB ، الشيء الوحيد الذي عليك فعله هو تقسيم الخادم الخلفي إلى غرف الكمبيوتر المختلفة.

cloud
← 返回新闻中心