สรุปและแนวทางแก้ไขปัญหาทั่วไปของตัวอย่าง ECS เซิร์ฟเวอร์ Alibaba Cloud
คำแนะนำ: เมื่อหลายคนติดต่อกับ Alibaba Cloud ECS(Elastic Compute Service) เป็นครั้งแรกพวกเขามักจะมีภาพลวงตานี้: "หลังจากซื้อเซิร์ฟเวอร์แล้วเว็บไซต์จะไม่ถูกส่งผ่านหรือ" ปรากฎว่าหลังจากออนไลน์จริงฉันพบว่าสิ่งที่รอคุณอยู่คือเว็บไซต์ไม่สามารถเปิดได้ซีพียูพุ่งสูงขึ้น SSH ไม่สามารถเชื่อมต่อได้แบนด์วิดท์ระเบิด... บทความนี้ไม่ได้พูดภาษาจีนกลางแต่จะอธิบายปัญหาและแนวทางแก้ไขที่พบบ่อยที่สุด10ประการของ ECS จากมุมมองของการดำเนินการและการบำรุงรักษาจริง
เหมาะสำหรับกลุ่มคน
ผู้ดูแลเว็บมือใหม่: ฉันเพิ่งติดต่อกับเซิร์ฟเวอร์คลาวด์และสับสนเกี่ยวกับการทำงานและการบำรุงรักษาของ Linux
นักพัฒนาแอปพลิเคชัน: ปรับใช้แอปพลิเคชันเช่น WordPress, Java, Python, Docker เป็นต้น
อีคอมเมิร์ซข้ามพรมแดน/การค้าต่างประเทศ: รักษาสถานีอิสระและธุรกิจข้ามพรมแดน
Linux Operation and Maintenance Xiaobai: คนที่ซื้อ ECS แต่ไม่รู้วิธีดูแลรักษาทุกวัน
1.เหตุใด IP เครือข่ายสาธารณะจึงไม่สามารถเปิดได้? (90% ของปัญหานี้)
นี่เป็นคำถามที่มือใหม่ถามบ่อยที่สุด: การเข้าถึงเบราว์เซอร์หมดเวลา SSH ไม่สามารถเชื่อมต่อได้และเจดีย์ไม่สามารถเปิดได้
สาเหตุพื้นฐาน:
Alibaba Cloud เปิดอยู่โดยค่าเริ่มต้น
ไฟร์วอลล์กลุ่มความปลอดภัย
การเข้าถึงภายนอกส่วนใหญ่ถูกบล็อกโดยค่าเริ่มต้น
โซลูชัน
เข้าสู่คอนโซล ECS → กลุ่มความปลอดภัย → กฎทิศทาง
ตรวจสอบให้แน่ใจว่าได้ปล่อยพอร์ตที่ใช้กันทั่วไปดังต่อไปนี้:
ชื่อบริการ
หมายเลขพอร์ต
คำแนะนำ
SSH
ยี่สิบสอง
จำเป็นสำหรับการเชื่อมต่อขั้นพื้นฐาน
HTTP
แปดสิบ
บริการเว็บไซต์
HTTPS
443
บริการเข้ารหัสเว็บไซต์
แผงเจดีย์
แปดพันแปดร้อยแปดสิบแปด
พอร์ตเริ่มต้น (แนะนำให้แก้ไขภายหลัง)
MySQL
3306
ห้ามมิให้เปิดเครือข่ายสาธารณะโดยเด็ดขาด
Redis
หกพันสามร้อยเจ็ดสิบเก้า
ขอแนะนำให้เข้าถึงอินทราเน็ตเท่านั้น
หลุมที่ซ่อนอยู่: ไฟร์วอลล์ภายในระบบ
หากคุณเปิดกลุ่มความปลอดภัยและยังไม่สามารถเปิดได้โดยปกติแล้วไฟร์วอลล์ (Firewalld หรือ UFW) ที่มาพร้อมกับระบบ Linux จะถูกบล็อก
Bash
# CentOS หยุดไฟร์วอลล์
Systemctl stop firewalld
Systemctl disable firewalld
# Ubuntu หยุดไฟร์วอลล์
Ufw disable
2.ทำไมโหลด CPU ถึงเต็ม100%?
1.เว็บไซต์ถูกโจมตีโดย CC
โดยเฉพาะผู้ใช้ WordPress ผู้โจมตีจะร้องขออย่างบ้าคลั่ง
/Wp-login.php
หรือ
/Xmlrpc.php
, ระบาย CPU ทันที
มาตรการรับมือ: เปิดขีดจำกัดกระแส Nginx หรือใช้ Alibaba Cloud WAF
2.การเลือกการกำหนดค่าต่ำเกินไป
การกำหนดค่า1คอร์1G หรือ1คอร์2G โดยพื้นฐานแล้วจะอยู่ในสถานะ "ปลอมตาย" หลังจากเรียกใช้ MySQL Docker Java
คำแนะนำการกำหนดค่าจริง:
บล็อกส่วนตัว: 2แกน2G เริ่มต้น
WordPress/สถานีการค้าต่างประเทศ: 2-core 4G เริ่มต้น
โครงการ Java: หน่วยความจำอย่างน้อย8G เริ่มต้น
3.ฉันควรทำอย่างไรหากการเชื่อมต่อระยะไกล (SSH) ล้มเหลว?
เมื่อแจ้ง
Connection timed out
โปรดตรวจสอบตามลำดับนี้:
ตรวจสอบกลุ่มความปลอดภัย: ยืนยันว่าพอร์ต22ถูกปล่อยออกมาหรือไม่
ใช้ฟังก์ชัน VNC: คอนโซล Alibaba Cloud ให้ "Send Remote Command (VNC)" ซึ่งเป็น "ฟางช่วยชีวิต" ที่สามารถเข้าสู่ระบบได้แม้ว่า SSH จะล่มก็ตาม
ตรวจสอบสถานะบริการ SSH:
บาช
# ดูสถานะบริการ
Systemctl status sshd
# บริการ SSH เริ่มต้นใหม่
Systemctl restart sshd
ประการที่สี่เว็บไซต์ปรากฏขึ้นอย่างกะทันหัน502 Bad Gateway?
502มักหมายถึง Nginx ปกติแต่
โปรแกรมแบ็คเอนด์หยุดทำงาน
。
สาเหตุทั่วไป: หน่วยความจำไม่เพียงพอ (OOM Killer) ทำให้กระบวนการถูกฆ่าโดยระบบ
คำสั่งแก้ไขปัญหา:
บาช
# ดูบันทึกระบบเพื่อดูว่ามีคำว่า Killed process หรือไม่
Dmesg-T | grep -i oom
แก้ไข: เพิ่มประสิทธิภาพการใช้หน่วยความจำโปรแกรมหรือเพิ่มพาร์ติชัน Swap 。
5.พื้นที่ดิสก์เต็มอย่างอธิบายไม่ได้?
เห็นได้ชัดว่าไม่มีหลายสิ่งหลายอย่าง
Df-h
แวบแรกมัน100%
การสะสมบันทึก: บันทึกระบบหรือบันทึกแอปพลิเคชันในไดเร็กทอรี/var/log ไม่ได้ตั้งค่าการล้างข้อมูลแบบเลื่อน
กระจก Docker: สารตกค้างที่เกิดจากการสร้างบ่อยๆ Bash # ทำความสะอาดข้อมูล Docker ไร้ประโยชน์ docker system prune -a
ค้นหาไฟล์ขนาดใหญ่: ค้นหาแหล่งที่มาได้อย่างรวดเร็ว
บาช
# ดูขนาดของแต่ละโฟลเดอร์ในไดเรกทอรีราก
Du-sh/ *
''
---
# #6.ทำไมต้นทุนแบนด์วิดท์จึงแพงขึ้นเรื่อยๆ?
แบนด์วิดท์เครือข่ายสาธารณะของ ECS มีราคาแพงมากหากคุณคายทรัพยากรแบบคงที่เช่นรูปภาพและวิดีโอโดยตรงผ่าน ECS แบนด์วิดท์จะระเบิดในไม่ช้า
** สถาปัตยกรรมที่ถูกต้อง: ** 'ผู้ใช้-> CDN (เครือข่ายการกระจายเนื้อหา) -> ECS'
** ประโยชน์: ** ทรัพยากรแบบคงที่ถูกแคชไว้ที่โหนด CDN, ECS จัดการเฉพาะตรรกะหลักซึ่งช่วยลดต้นทุนแบนด์วิดท์ได้อย่างมาก
---
# #7.ยิ่งใช้ฐานข้อมูลยิ่งช้า?
มันเร็วในตอนแรกและติดอยู่ในครึ่งปีต่อมานี่ไม่ใช่การลดลงของประสิทธิภาพ ECS แต่เป็นดัชนี ** หายไป ** หรือ ** แบบสอบถามช้า **
** เครื่องมือเพิ่มประสิทธิภาพ: ** ติดตั้ง 'mysqltuner' สำหรับการวินิจฉัยอัตโนมัติ
** ดูการเชื่อมต่อแบบ real-time: **
''Sql
-ดำเนินการใน MySQL
SHO
W PROCESSLIST;
8.การป้องกันความปลอดภัย: อย่ารอจนกว่าคุณจะถูก "แฮ็ก" เพื่อเสียใจ
ตราบใดที่คุณมี IP สาธารณะหุ่นยนต์จะสแกนรหัสผ่านของคุณทุกวินาที
แก้ไขพอร์ต SSH เริ่มต้น: เปลี่ยน22เป็นพอร์ตสุ่มระหว่าง20000-60000。
ห้ามไม่ให้รากเข้าสู่ระบบโดยตรง:
บาช
# แก้ไข/etc/ssh/sshd_config
PermitRootLogin no
'''
3. ** ใช้คีย์ SSH: ** ปิดการใช้งานรหัสผ่านเข้าสู่ระบบอย่างสมบูรณ์
4. ** ติดตั้ง Fail2ban:** ห้ามแคร็กที่มีความรุนแรงโดยอัตโนมัติ
---
# #9."หลุม" ของการกู้คืนสแนปชอต
ภาพรวมไม่ใช่ยาครอบจักรวาลหากมีการสร้างสแนปชอตในระหว่างการเขียนฐานข้อมูลที่มีความถี่สูงข้อมูลอาจไม่สอดคล้องกันหลังจากการกู้คืน
* ** แนวทางปฏิบัติที่ดีที่สุด: ** หยุดบริการฐานข้อมูลก่อนการกู้คืนในขณะเดียวกันให้สแนปชอตดิสก์ระบบและดิสก์ข้อมูลเพื่อป้องกันไม่ให้เวอร์ชันไม่ตรงกัน
---
# #10.สรุป: จาก "การก่อสร้าง" เป็น "การดำเนินการและการบำรุงรักษา"
เกณฑ์ที่แท้จริงของ ECS ไม่ใช่การ "ซื้อ" แต่เป็นการ "เลี้ยง"
ระบบปฏิบัติการและบำรุงรักษาที่เป็นผู้ใหญ่ควรประกอบด้วย:
* ** การตรวจสอบ: ** การแจ้งเตือนการตรวจสอบระบบคลาวด์ของอาลีบาบา (CPU, หน่วยความจำ, แบนด์วิดท์)
** ความปลอดภัย: ** แก้ไขช่องโหว่ของระบบอย่างสม่ำเสมอ
** การสำรองข้อมูล: ** อัตโนมัติสแนปชอตสำรองข้อมูลที่สำคัญจากระยะไกล
** ในโลกของเซิร์ฟเวอร์เสถียรภาพมีความสำคัญมากกว่าคุณสมบัติแฟนซี **
---

