Microsoft Cloud ไม่กลัวเหตุฉุกเฉินของการหยุดทำงานในห้องคอมพิวเตอร์: ใช้ Azure Site Recovery เพื่อสร้างโปรแกรมฝึกซ้อมการกู้คืนระบบที่มีความพร้อมใช้งานสูง

เมฆ 2026-06-05 阅读 7
cloud

ในแวดวงไอทีมีฉันทามติของอุตสาหกรรมที่ทำให้ผู้คนคิดอย่างรอบคอบ: "มีเซิร์ฟเวอร์เพียงสองประเภทในโลกเซิร์ฟเวอร์หนึ่งหยุดทำงานและอีกประเภทหนึ่งกำลังหยุดทำงาน"

ไม่ว่าจะเป็นฝนตกหนักอย่างกะทันหันและน้ำท่วมในห้องคอมพิวเตอร์ในพื้นที่ไฟดับทางกายภาพที่ร้ายแรงหรือสภาพอากาศที่รุนแรงซึ่งหาได้ยากในบางพื้นที่ของระบบคลาวด์เมื่อระบบธุรกิจหลักถูกระงับเป็นเวลาหลายชั่วโมงความสูญเสียทางเศรษฐกิจโดยตรงและวิกฤตความไว้วางใจของแบรนด์ที่เกิดขึ้นกับบริษัทมักจะเป็นหายนะเพศ. ในอดีตการสร้างสภาพแวดล้อมแบบ "ใช้งานได้หลากหลาย" หรือ "การเตรียมความร้อนและการกู้คืนระบบ" ในห้องคอมพิวเตอร์ไม่เพียงแต่ต้องใช้เงินหลายล้านดอลลาร์เพื่อซื้อฮาร์ดแวร์คู่และเช่าสายเฉพาะเท่านั้นแต่ยังต้องมีทีมผู้เชี่ยวชาญจำนวนมากเพื่อบำรุงรักษาทุกวัน.

แต่ในยุคของคลาวด์ดั้งเดิม Microsoft Cloud ได้จัดเตรียมสิ่งประดิษฐ์ที่ทนต่อภัยพิบัติที่เรียกว่า "การโจมตีลดมิติ"-

Azure Site Recovery (ASR สำหรับระยะสั้น)

。สามารถช่วยคุณเชื่อมต่อเครื่องจริงในเครื่องเครื่องเสมือน VMware/Hyper-V และแม้แต่เซิร์ฟเวอร์บนคลาวด์สาธารณะอื่นๆ

คัดลอกไปยัง Azure cloud ในไม่กี่วินาทีด้วยต้นทุนที่ต่ำมาก

。บทแนะนำเชิงลึกของวันนี้ไม่ได้พูดถึงเรื่องเสมือนจริงมือจะพาคุณไปสร้างชุดสถาปัตยกรรมการกู้คืนระบบ AVS/Local to Azure มาตรฐานและสอนวิธีทำ

การฝึกซ้อมการกู้คืนระบบด้วยปืนจริงโดยไม่มีการหยุดชะงักของธุรกิจ

แนวคิดหลัก: ASR คืออะไร? RPO และ RTO คำนวณอย่างไร?

ก่อนการกำหนดค่าแบบลงมือปฏิบัติผู้ออกแบบโซลูชันการกู้คืนระบบจะต้องบีบตัวบ่งชี้ฮาร์ดคอร์สองตัวก่อนนี่เป็นสองประเด็นที่เจ้านายกังวลมากที่สุด:

RPO (Recovery Point Target, Recovery Point Objective): พูดง่ายๆก็คือเวลาที่ข้อมูลได้รับอนุญาตให้ทิ้งหาก ASR ของคุณซิงโครไนซ์ข้อมูลทุกๆ5นาทีในกรณีที่เลวร้ายที่สุดคุณอาจสูญเสียข้อมูลคำสั่งซื้อล่าสุดเป็นเวลา5นาที

RTO (Recovery Time Target, Recovery Time Objective): พูดง่ายๆก็คือต้องใช้เวลานานแค่ไหนในการเปิดเครื่องสำรองข้อมูลบน Azure หลังจากที่ห้องคอมพิวเตอร์หลักหยุดทำงานเป็นนาทีสิบนาทีหรือครึ่งวัน?

จุดเด่นของ Azure Site Recovery คือการใช้

เทคโนโลยีการจำลองแบบต่อเนื่องน้ำหนักเบา

。ในเวลาปกติจะเข้ารหัสเฉพาะบล็อกข้อมูลดิสก์ของการเปลี่ยนแปลงที่เพิ่มขึ้นของโหนดหลักและส่งไปยังบัญชีจัดเก็บข้อมูลของ Azure อย่างต่อเนื่อง (ในขณะนี้ระบบคลาวด์ไม่ได้เปิดเครื่องเสมือนแต่รวบรวมข้อมูลดิสก์เท่านั้นดังนั้น

ฉันแทบไม่ได้ใช้เงินเลย

)。ในกรณีที่เกิดภัยพิบัติจะติดตั้งดิสก์เหล่านี้บนเครื่องเสมือนใหม่ในระบบคลาวด์ทันทีและเข้าครอบครองธุรกิจ

RPO ในระดับนาที RTO ในสิบนาที

ประสิทธิภาพสูงสุดระดับองค์กร

2.การออกแบบสถาปัตยกรรมหลัก: "Troika" ของการกู้คืนระบบ

โปรแกรมการออกกำลังกายการกู้คืนระบบ ASR ที่สมบูรณ์จำเป็นต้องประกอบด้วยสามส่วนหลักดังต่อไปนี้:

Source Environment (Source): ตอนนี้คุณกำลังดำเนินธุรกิจหลัก

สถานที่ (อาจเป็นสภาพแวดล้อม VMware เครื่องกายภาพหรือพื้นที่ Azure อื่น)

Recovery Services Vault: ค่ายฐานของ Azure Cloud มีหน้าที่จัดการกลยุทธ์การจำลองแบบทั้งหมดจัดเก็บข้อมูลดิสก์ที่เข้ารหัสและออก "คำสั่งเริ่มต้น" เมื่อเกิดภัยพิบัติ

Test VNet: หลายคนกลัว "การแสดงปลอมและการทำจริง" มากที่สุดเมื่อทำการฝึกซ้อมการกู้คืนระบบด้วยเหตุนี้ IP ของสภาพแวดล้อมการผลิตจึงขัดแย้งกันเราจำเป็นต้องวางแผนเครือข่ายทดสอบใน Azure ซึ่งโดยปกติจะแยกออกจากโลกโดยสิ้นเชิงแต่ส่วนเครือข่ายอินทราเน็ตจะเหมือนกับสภาพแวดล้อมการผลิตทุกประการสำหรับการฝึกซ้อม

3.ขั้นตอนแรก: เริ่มต้นค่ายฐานการกู้คืนระบบที่ฝั่ง Azure

ขั้นแรกให้ลงชื่อเข้าใช้ Azure Portal และพิมพ์ในแถบค้นหาด้านบน

"กู้คืนที่เก็บบริการ"

(Recovery Services Vaults) คลิกที่สร้าง

1.สร้างห้องนิรภัย

กลุ่มทรัพยากร: ขอแนะนำให้สร้างกลุ่มทรัพยากรการกู้คืนระบบโดยเฉพาะเช่น DR-Framework-RG

ชื่อ: ตั้งชื่อให้ดังก้องเช่น Primary-to-Azure-Vault

พื้นที่: วิกฤตสุดๆ! คุณต้องเลือกพื้นที่ Azure ที่มีที่ตั้งทางภูมิศาสตร์ที่แตกต่างจากห้องคอมพิวเตอร์ต้นทางของคุณตัวอย่างเช่นหากธุรกิจของคุณอยู่ในฮ่องกงค่ายฐานการกู้คืนระบบสามารถเลือกได้ในสิงคโปร์ (Southeast Asia)

2.กำหนดค่าการเตรียมโครงสร้างพื้นฐาน (คัดลอกเครื่องเสมือน Azure หรือสภาพแวดล้อมในท้องถิ่นเป็นตัวอย่าง)

เข้าสู่ที่เก็บข้อมูลที่สร้างขึ้นและค้นหาในเมนูด้านซ้าย

"Site Recovery"

-> คลิก

"เตรียมโครงสร้างพื้นฐาน (Prepare infrastructure)"

เครื่องของคุณอยู่ที่ไหน? เลือกแหล่งที่มาของคุณ (เช่น Azure หรือ VMware)

คุณต้องการคัดลอกไปที่ใดเลือก "เป็น Azure"

ปรับใช้ซอฟต์แวร์การกำหนดค่า (สำหรับสภาพแวดล้อมภายในเครื่อง): หากเป็นการย้ายห้องคอมพิวเตอร์ในเครื่อง ASR จะขอให้คุณดาวน์โหลดอุปกรณ์คัดลอก ASR (เทมเพลต OVA) เพื่อปรับใช้ในเครื่องเปรียบเสมือน "หัวหน้าทีมขนย้าย" ซึ่งมีหน้าที่ในการเข้ารหัสบีบอัดและลดความไวของข้อมูลดิสก์ในเครื่องจากนั้นส่งไปยัง Azure อย่างปลอดภัย

4.ขั้นตอนที่สอง: เปิด "สำเนาบ้า" ของวัตถุที่ได้รับการป้องกัน

หลังจากเปิดโครงสร้างพื้นฐานแล้วเราต้องเลือกว่าเครื่องเสมือนหลักใดที่ต้องสวม "ชุดเกราะ" นี้

คลิก "คัดลอก (คัดลอก)" ในอารักขา

เลือกเครื่องเสมือนต้นทาง: ตรวจสอบเว็บเซิร์ฟเวอร์หลักหรือเซิร์ฟเวอร์ฐานข้อมูลของคุณ (เช่น Prod-DB-01)

การกำหนดค่าเป้าหมาย: กลุ่มทรัพยากรเป้าหมาย: เครื่องคลาวด์ถูกสร้างขึ้นที่ไหนเมื่อเกิดภัยพิบัติ? เลือกกลุ่มทรัพยากรที่คุณเตรียมไว้ล่วงหน้าเครือข่ายเป้าหมาย (VNet): เลือกการผลิตในระบบคลาวด์

เครือข่าย (ใช้ในการครอบครองเมื่อเกิดภัยพิบัติจริง) ทดสอบเครือข่าย (Test VNet): (เน้น!) เลือกเครือข่ายการทดสอบที่โดดเดี่ยวที่เรากล่าวถึงก่อนหน้านี้

นโยบายการคัดลอก: * กำหนดเวลาการเก็บรักษาสำหรับจุดกู้คืนความสอดคล้องของข้อขัดข้องและจุดกู้คืนความสอดคล้องของแอปพลิเคชัน (โดยปกติจะเป็นค่าเริ่มต้น24ชั่วโมง) ความสอดคล้องของแอปพลิเคชัน: ASR จะใช้เทคโนโลยี VSS ของ Windows หรือสคริปต์แฮงค์ของ Linux เพื่อให้แน่ใจว่าข้อมูลในหน่วยความจำปลอดภัยก่อนที่จะคัดลอกสิ่งนี้จำเป็นสำหรับฐานข้อมูลเช่น SQL Server/Oracle

คลิก "เปิดใช้งานการคัดลอก" จากนั้นระบบจะดำเนินการ "การซิงโครไนซ์การเริ่มต้นเต็มรูปแบบ" ครั้งแรก (ใช้เวลานานขึ้นอยู่กับแบนด์วิดท์ในเครื่องและขนาดดิสก์ของคุณ) เมื่อคุณเห็นสถานะในรายการ

"การป้องกัน (Protected)"

และด้วยตะขอสุขภาพสีเขียวค่ายฐานการกู้คืนระบบก็เสร็จสมบูรณ์อย่างเป็นทางการ

5.ขั้นตอนที่สาม: การฝึกซ้อมรบจริง-"การฝึกซ้อมทางทหาร" โดยไม่มีการหยุดชะงัก

หากคุณมีแผนการกู้คืนระบบโดยไม่ต้องเจาะแสดงว่าคุณซื้อประกันและไม่ทราบหมายเลขโทรศัพท์สำหรับการเรียกร้องค่าสินไหมทดแทนสิ่งประดิษฐ์ที่ยิ่งใหญ่ที่สุดของ ASR คือการสนับสนุน

"ทดสอบ Failover"

。สามารถจำลองการครอบครองห้องคอมพิวเตอร์ที่สมบูรณ์ในระบบคลาวด์โดยไม่ส่งผลกระทบต่อการทำงานปกติของสภาพแวดล้อมการผลิตในพื้นที่และไม่ขัดขวางการเข้าถึงของลูกค้าออนไลน์

ขั้นตอนการดำเนินการเจาะ:

เข้าสู่รายการเครื่องเสมือน AVS / ASR และเลือกเครื่องเสมือนฐานข้อมูลที่คุณได้รับการป้องกัน

คลิก "Test Failover" ที่ด้านบน

เลือกจุดกู้คืน: เลือกจุด "การประมวลผลล่าสุด" หรือ "ความสอดคล้องของแอปพลิเคชันล่าสุด"

ทดสอบเครือข่าย: คุณต้องเลือก VNet ทดสอบที่แยก

คลิกตกลงณจุดนี้ ASR จะแสดงพลังอันยิ่งใหญ่: มันคัดลอกอิมเมจดิสก์ในบัญชีจัดเก็บข้อมูลของคุณในระบบคลาวด์อย่างเงียบๆจากนั้นภายในไม่กี่นาทีเครื่องเสมือนจริงจะถูกสร้างขึ้นจากอากาศบางๆ

ผลการตรวจสอบ: ลงชื่อเข้าใช้เครื่องเสมือนทดสอบที่เพิ่ง "ฟื้นคืนชีพ" ในระบบคลาวด์ตรวจสอบว่าบริการฐานข้อมูลเริ่มทำงานตามปกติหรือไม่และข้อมูลยังคงอยู่หรือไม่

การล้างข้อมูลด้วยคลิกเดียว: หลังจากเจาะเสร็จแล้วให้คลิก "ล้างข้อผิดพลาดในการทดสอบ" เขียนบันทึกการออกกำลังกายของคุณ (เช่น "การออกกำลังกายสำเร็จ RTO 8นาที") Azure จะทำลายเครื่องเสมือนชั่วคราวและดิสก์ทั้งหมดที่สร้างขึ้นเนื่องจากการออกกำลังกายในตอนนี้ทันทีและจะไม่ปล่อยให้คุณเสียเงินเพิ่ม

6.คู่มือการระบายน้ำขั้นสูงสุดและการปรับแต่งการผลิต

เมื่อผลักดัน ASR ไปสู่สภาพแวดล้อมการผลิตสถาปนิกอาวุโสจะให้ความสำคัญกับรายละเอียดต่อไปนี้:

Churn Limit: ASR มีขีดจำกัดสูงสุดสำหรับปริมาณการเขียนต่อวินาที (ปริมาณงาน) ของข้อมูลดิสก์เดียวหากฐานข้อมูลของคุณเป็นมอนสเตอร์ขนาดใหญ่ที่มีปริมาณงานพร้อมกันสูงมากขอแนะนำให้ใส่ฐานข้อมูล

ดิสก์บันทึกชั่วคราว (เช่น tempdb ของ SQL Server) ไม่รวมอยู่ในรายการคัดลอกและคัดลอกเฉพาะดิสก์ข้อมูลหลักเท่านั้นสิ่งนี้ไม่เพียงแต่ป้องกันไม่ให้เกินขีดจำกัดปริมาณงาน ASR แต่ยังช่วยประหยัดค่าบริการข้อมูลเครือข่ายได้มาก

แผนกู้คืน (Recovery Plans): ธุรกิจจริงมักมีเครื่องจักรจำนวนมาก (ส่วนหน้าส่วนหลังฐานข้อมูล) คุณไม่สามารถบูตได้ในช่วงเวลาที่มีการหยุดทำงานที่น่ากลัวจริงๆการใช้ฟังก์ชัน "แผนการกู้คืน" ของ ASR คุณสามารถเขียนสคริปต์: ขั้นตอนที่1เปิดฐานข้อมูลพื้นฐานก่อนขั้นตอนที่2รอ3นาทีเพื่อให้การตรวจสอบสุขภาพฐานข้อมูลผ่านและขั้นตอนที่3เปิดเว็บเครื่องส่วนหน้าด้วยวิธีนี้ระบบทั้งหมดในคลิกเดียวสามารถคืนชีพได้โดยอัตโนมัติ

สรุป

ก่อนที่จะไม่มีการประมวลผลแบบคลาวด์การกู้คืนจากภัยพิบัติเป็น "ความหรูหรา" ที่มีเพียงยักษ์ใหญ่ทางการเงินชั้นนำและผู้ผลิตข้ามชาติเท่านั้นที่สามารถจ่ายได้การเกิดขึ้นของ Azure Site Recovery ได้นำเทคโนโลยีที่ไม่สามารถบรรลุนี้ไปสู่ระดับพลเรือนอย่างสมบูรณ์

โดยปกติคุณจะต้องจ่ายสำหรับพื้นที่จัดเก็บดิสก์ราคาถูกมากและค่าธรรมเนียมใบอนุญาตพื้นฐานและเมื่อต้องเผชิญกับภัยพิบัติที่เกิดขึ้นอย่างกะทันหันเช่นไฟไหม้ในห้องคอมพิวเตอร์ไฟฟ้าดับหรือการขู่กรรโชกของแฮ็กเกอร์คุณสามารถทำได้ภายในสิบนาทีโดยการวางแผนแผนการกู้คืนล่วงหน้า, ให้สินทรัพย์ไอทีของทั้งบริษัทเกิดใหม่อย่างปลอดภัยในระบบคลาวด์นี่คือ "ความรู้สึกปลอดภัย" ที่ยากที่สุดที่สถาปัตยกรรมคลาวด์สมัยใหม่มอบให้กับทุกองค์กร

cloud
← 返回新闻中心