Pembelian akaun Tencent Cloud: Kadar menganggur CPU harian pelayan Tencent Cloud CVM setinggi 80% bagaimana mengurangkan kos
Dalam rang undang-undang infrastruktur IT korporat, terdapat "jenaka sejuk" yang sangat tidak masuk akal tetapi universal:
Syarikat itu membayar ribuan atau bahkan ratusan ribu yuran pelayan kepada pengeluar awan setiap bulan, tetapi apabila anda mengklik keluk pemantauan konsol, kadar penggunaan CPU harian pelayan mewah itu sering hanya 10% yang menyedihkan. Hingga 20%.
Apa yang dilakukan oleh baki 80% kuasa pengkomputeran? Tidur, memancing, membakar wang dengan sia-sia.
Pembelian Akaun Awan Tencent
Sebagai pengarah teknikal, arkitek atau pengurus kewangan, anda mungkin telah melihat kadar kekosongan harian Tencent Cloud CVM (pelayan awan) berkali-kali dan mengetap gigi. Tetapi setiap kali anda mencadangkan untuk "mengurangkan 8 teras menjadi 2 teras", pasukan teknikal selalu mempunyai banyak alasan yang sah untuk mengembalikan anda:
"Apa yang harus saya lakukan sekiranya promosi acara itu tinggi?", "Laporan kumpulan berjalan di latar belakang pada awal pagi, CPU akan penuh dalam sekelip mata, dan sistem pengedaran akan tersekat!"
Untuk mengatasi kemungkinan puncak perniagaan hanya 5% dalam setahun, syarikat harus mempertahankan peruntukan berlebihan 100% sepanjang tahun. Ini adalah "persiapan taktikal untuk menutup sampah strategik."
Hari ini, kita tidak akan membincangkan prinsip-prinsip struktur ilusi, tetapi secara langsung dapat mendarat dan memotong bil. Ajar anda cara menggunakan penyesuaian dinamik (pengembangan elastik)
Dengan
Contoh penawaran (Spot Instance) Kedua pisau cukur ini mengeluarkan 80% kuasa pengkomputeran pelayan CVM Tencent Cloud yang tidak berfungsi, menjadikan kos awan anda turun dari tebing.
1. Analisis lesi: Mengapa CPU harian pelayan CVM anda tidak berfungsi 80%?
Untuk mengurangkan kos, kita mesti terlebih dahulu memahami bagaimana 80% kemalasan ini berasal. Di kebanyakan perusahaan kecil dan sederhana, pelayan terbiar biasanya disebabkan oleh dua pemikiran operasi dan penyelenggaraan tradisional "mendalam" berikut:
1. Pemikiran "sekali-untuk-semua" spesifikasi statik
Pada peringkat awal projek, banyak pasukan membeli pelayan untuk "menampar kepala mereka" atau mengikuti puncak ujian tekanan tertinggi. Saya membeli CVM bulanan 32G 8-teras, dan sistem terus berjalan.
Tetapi lalu lintas perniagaan syarikat dilahirkan
Kesan pasang surut
。 Sistem pejabat (OA, CRM) hanya dapat digunakan untuk berulang-alik pada siang hari, dan benar-benar mati pada waktu malam; aplikasi e-dagang atau hiburan, lalu lintas tertumpu dari jam 8 hingga 11 malam, dan pada dasarnya tidak ada orang pada awal pagi dan pagi. Menggunakan satu set konfigurasi tahunan dan bulanan yang tidak dapat disentuh untuk menghilangkan aliran pasang surut pasti akan menyebabkan sejumlah besar daya pengkomputeran terbiar dalam tempoh yang rendah.
2. Perniagaan teras dan perniagaan bukan teras "sama tinggi"
Untuk menstabilkan persekitaran pengeluaran syarikat, dapat difahami untuk membeli model eksklusif peringkat perusahaan (seperti standard S5 dan S6). Namun, ketika banyak pasukan membangun lingkungan pengujian, lingkungan pengembangan, lingkungan pra-produksi, atau menjalankan simpul pengkomputeran yang diedarkan dengan data besar, mereka masih menyalin mesin konfigurasi tinggi tahunan dan bulanan lingkungan produksi. Mesin-mesin ini tidak digunakan sama sekali pada hujung minggu, tetapi mereka masih dicas 24 jam sehari.
2. Pisau cukur pertama: konfigurasi"
Jalur pasang surut ", pemotongan puncak automatik dan pengisian lembah dengan pengembangan elastik
Oleh kerana lalu lintas mempunyai pasang surut, pelayan harus seperti gelang getah, yang boleh memanjang atau dipendekkan. Tencent Cloud menyediakan alat kecekapan sepenuhnya-
AS (pengembangan elastik)
, Bekerjasama
Kumpulan teleskopik elastik
Dan
CLB (pengimbangan beban)
, Ini adalah penyelesaian paling ortodoks untuk menyelesaikan CPU terbiar.
1. Logik teras: dari "langganan tahunan dan bulanan" hingga "langganan tahunan dan bulanan asas, pembayaran berdasarkan jumlah dinamik"
Jangan beli semua pelayan sebagai pakej tahunan dan bulanan. Reka bentuk seni bina yang betul mestilah:
Tetap dengan jaminan minimum (langganan tahunan dan bulanan): Nilaikan permintaan perniagaan anda pada titik terendah pada awal pagi. Sebagai contoh, hanya memerlukan dua mesin 4G 2 teras untuk membawa lalu lintas asas. Kemudian anda hanya membeli 2 unit ini dengan langganan tahunan dan bulanan.
Letupan elastik (ditagih mengikut kuantiti): Gantung kedua mesin ini di belakang load balancing (CLB), dan buat kumpulan pengembangan elastik pada masa yang sama.
2. Konfigurasi penghindaran lubang pertempuran sebenar: selamat tinggal kepada penambahan biadab
Pembelian akaun Tencent Cloud
Ramai orang menggunakan pengembangan elastik dan suka menetapkan * "Apabila CPU melebihi 80%, tambahkan 1 mesin secara automatik" *. Percayalah, ini mungkin akan terbalik dalam talian. Kerana ketika CPU mencapai 80%, CVM baru sering memerlukan 2 hingga 3 minit dari penciptaan, permulaan sistem, dan persekitaran inisialisasi. Apabila mesin baru ditambahkan ke kluster, mesin lama mungkin sudah lama mati kerana beban berlebihan.
Postur konfigurasi lanjutan yang betul: Strategi masa: Sekiranya perniagaan anda mempunyai pasang surut yang sangat biasa (contohnya, orang mula meningkat pada pukul 9 pagi setiap hari), anda boleh menggunakan peraturan masa secara langsung: secara automatik menambah 2 pelayan penagihan mengikut jumlah pada jam 08:45 setiap hari, biarkan Mesin "menunggu" lalu lintas dan bukannya membiarkan lalu lintas "bergegas" mesin. Strategi portfolio pelbagai penunjuk: Jangan hanya memantau CPU. Kadang-kadang CPU tidak penuh, tetapi lebar jalur intranet atau sambungan TCP penuh. Tetapkan keadaan pencetus gabungan "CPU> 60% atau penggunaan memori> 70% atau lebar jalur intranet> 80%" untuk menempah ruang penyangga sistem yang mencukupi. Pelepasan dinamik: Pada pukul 10 malam, lalu lintas surut dan strategi dipicu secara automatik, melepaskan mesin-mesin ini yang ditagih dengan kuantiti. Hanya dengan membayar kuasa pengkomputeran yang benar-benar digunakan, 80% masalah kemalasan pada siang hari dapat diselesaikan.
3. Pisau cukur kedua: contoh penawaran (Spot), gunakan "potongan 10% dari harga patah tulang" untuk membeli kekuatan pengkomputeran pengeluar utama
Sekiranya pengembangan fleksibel adalah untuk mengoptimumkan langganan tahunan dan bulanan secara melampau, maka Spot Instance adalah "plug-in" awam yang ditinggalkan oleh Tencent Cloud untuk operasi dan penyelenggaraan lanjutan.
1. Apakah contoh penawaran?
Tencent Cloud telah membina begitu banyak bilik komputer di seluruh dunia, mustahil setiap pelayan fizikal dimuat sepenuhnya setiap saat. Kekuatan pengkomputeran fizikal yang tidak dibeli dan tidak berfungsi juga terbiar (tetapi juga membakar bil elektrik), jadi Tencent Cloud memasukkannya ke dalam "contoh penawaran" dan menjualnya dengan harga rendah di pasaran.
Godaan: prestasi dan kuantiti biasa
CVM penagihan sama persis, tidak ada perbezaan. Tetapi harganya selalunya hanya 10% hingga 20% dari bil mengikut kuantiti. Untuk pelayan dengan harga asal 2 yuan sejam, contoh penawaran mungkin hanya 2 sen.
Risiko maut: Ia boleh dikitar semula secara paksa oleh vendor awan pada bila-bila masa. Apabila Tencent Cloud mendapati bahawa seseorang bersedia membeli mesin ini dengan harga penuh, atau sumber ruang komputer ketat, sistem akan menghantar notis penamatan kepada anda 2 minit lebih awal, dan kemudian secara paksa mematikan dan melepaskan mesin, dan menghapus semua data.
2. Bagaimana syarikat rentas sempadan/stesen bebas/data besar menggunakan contoh penawaran untuk menjana wang?
Ketika mereka mendengar bahawa "ia boleh dikitar semula pada bila-bila masa", banyak operasi dan penyelenggaraan tradisional segera menggelengkan kepala:
"Bagaimana ini boleh digunakan? Sekiranya perniagaan terganggu, bos tidak akan membuka saya?"
Pemikiran berubah luas. Selagi anda "memisahkan pergerakan dan statik" dan "keadaan tidak sensitif" perniagaan, contoh penawaran adalah artifak penjimatan wang.
Senario A: Persekitaran ujian DevOps dan persekitaran ujian syarikat penyusunan automatik CICD, tidak ada yang menggunakannya setiap malam dan hujung minggu, mengapa membeli langganan tahunan dan bulanan? Gunakan kumpulan pengembangan fleksibel Tencent Cloud secara langsung, dan semua contoh tawaran pembelian ditentukan di bahagian belakang. Setiap hari pada pukul 9 pagi, 5 unit contoh tawaran dengan potongan 10% dikeluarkan secara automatik untuk membentuk kluster ujian, yang akan dilepaskan secara automatik setelah bekerja pada jam 6 petang. Walaupun ia dikitar semula secara tidak sengaja oleh Tencent Cloud pada siang hari, pengembangan elastik secara automatik akan membuka satu untuk membuatnya dalam beberapa saat. Bil pelayan ujian selama satu bulan boleh dipotong secara langsung sebanyak 80%.
Senario B: Pengkomputeran data besar luar talian, transkoding video, rendering AI, perkhidmatan ini dicirikan oleh tugas yang dapat "dicincang". Sebagai contoh, jika terdapat 10,000 video yang perlu ditranskod, anda perlu berjalan selama 10 hari dengan 10 mesin langganan tahunan dan bulanan biasa. Sekiranya anda menggunakan contoh penawaran Struktur tanpa status: belanjakan anggaran yang sangat rendah secara langsung, dan buka 100 contoh penawaran dengan potongan 10% dalam sekelip mata. Gunakan pengkomputeran yang diedarkan (seperti simpul Hadoop data besar, simpul diedarkan Jenkins) untuk membuang tugas dan mengebom tanpa pandang bulu. Walaupun dua mesin dikitar semula oleh Tencent Cloud semasa proses berjalan, dan mesin yang tersisa terus berjalan, tugas transkoding dapat diselesaikan dalam setengah hari. Bukan sahaja kelajuannya 20 kali lebih cepat, kosnya juga jauh lebih rendah daripada sebelumnya.
Senario C: Pelayan aplikasi web yang dipasang di belakang CLB (load balancing) oleh nod web "jenis makanan meriam" dari laman web yang sangat serentak, selagi "tidak berstatus" (iaitu, sesi tidak disimpan di pelayan tempatan, tetapi dihoskan di Redis luaran Dalam cache terpusat; fail yang dimuat oleh pengguna tidak disimpan secara tempatan, semua ditulis terus ke storan objek OSS/COS). Pada masa ini, anda boleh mengganti 70% mesin dalam kluster dengan contoh penawaran. Mereka hanya bertanggungjawab untuk satu perkara: menghuraikan kod dan meneruskan permintaan. Walaupun seseorang tiba-tiba dikitar semula, load balancing (CLB) akan dikeluarkan secara automatik, dan pengguna tidak mempunyai persepsi. Anda menggunakan "makanan meriam" untuk meningkatkan serentak seluruh rangkaian, dan semua yang anda simpan adalah keuntungan bersih.
Keempat, Tencent Cloud menjatuhkan "lembaran cheat kerja rumah utama"
Agar anda dapat menjemput bos anda esok
Gong, kami meringkaskan strategi penyesuaian dinamik dan pengurangan kos ini menjadi model pendaratan minimalis:
Peranan pelayan perniagaan
Mod pembelian yang disyorkan
Strategi teras untuk mengurangkan kos
Jangkaan untuk menjimatkan belanjawan
Pangkalan Data Teras (MySQL / Redis)
Pakej tahunan dan bulanan (spesifikasi eksklusif)
Tidak ada gangguan yang dibenarkan. Walau bagaimanapun, SQL lambat perlu diperiksa secara berkala, dan peruntukan dikurangkan dengan meningkatkan kecekapan kod, tanpa pengembangan elastik.
0% (keselamatan pertama)
Aplikasi Web Teras/Portal API
Pakej tahunan dan bulanan pemastautin
Gunakan pengembangan elastik (AS). Biarkan 2 set jaminan di palung, yang secara automatik diperluas mengikut CPU dan lebar jalur pada siang hari, dan dilepaskan secara automatik pada larut malam.
30% - 50%
Persekitaran ujian/pembangunan, kluster pra-pengeluaran
Mesin suis masa atau contoh penawaran murni
Matikan secara automatik selepas bekerja. Atau gunakan contoh penawaran (Spot) sepenuhnya, lepaskan secara langsung selepas bekerja, dan mulakan semula di tempat kerja.
70% - 80%
Pengiraan luar talian, kumpulan berjalan, transkoding video
Contoh pembidaan murni (pengiraan kumpulan)
Bekerjasama dengan kumpulan simpul penawaran Tencent Cloud Batch (pengiraan kumpulan) atau perkhidmatan kontena (TKE), tugas dipotong dan berjalan tanpa keadaan.
Lebih daripada 80%
Lima, kesimpulan
Dalam era operasi dan penyelenggaraan awan dan halus, standard untuk mengukur kecemerlangan pasukan teknikal bukan lagi "sama ada sistem dapat dibina", tetapi "bolehkah anda menggunakan seni bina yang paling elegan dan menghabiskan paling sedikit wang? Jalankan sistem dengan stabil."
Pembelian akaun Tencent Cloud
Menjaga 80% daripada kadar menganggur CPU adalah kejahatan besar terhadap aliran tunai korporat. Buang pemikiran lama "sekali-untuk-semua" langganan tahunan dan bulanan, tinggalkan teras stabil untuk langganan tahunan dan langganan bulanan, serahkan aliran pasang surut ke pengembangan elastik, dan dengan berani membuang kuasa pengkomputeran tanpa status ke contoh tawaran diskaun 10%. Apabila anda mengetahui peraturan permainan Tencent Cloud yang fleksibel, anda akan dapati bahawa memotong separuh daripada anggaran IT anda boleh menjadi sangat tenang.

