Amazon CloudのGPUサーバーはどのように課金されるのか?Amazon EC2 G4dn/G5インスタンスの演算性能と価格を徹底解説

クラウド 2026-06-03 阅读 6
cloud

人工知能や大規模モデルの微調整、グラフィックスレンダリングが爆発的に注目される現在、自分専用の高性能なGPUを購入するのは高価なうえに、しばしば品薄状態に陥っています。そこで、大多数の開発者やアーキテクト、スタートアップチームは、クラウド――とりわけクラウドの雄であるAmazon Web Services(AWS)――に目を向けます。

Amazon EC2 GPUインスタンス

AWSのGPUファミリーにおいて、

G4dn

そして

G5

年間を通じて爆買いされる“オールラウンドなコスパ最強スマホ”に属する。それらはAI推論や小規模モデルの微調整を実行できるだけでなく、3Dレンダリングやクラウドゲームも十分に担い切ることができます。

しかし、AWSに初めて触れる多くの人は、迷宮のような課金ルールや多種多様なインスタンス仕様に混乱してしまうことがよくあります。料金プランを誤って選んだり、電源の切り忘れたりして、月末に目が覚めるような高額な請求書が届くことがよくあります。

本日のチュートリアルでは、いきなり本格的な実践内容に突入します。PPTの概念論は一切省き、最も身近な言葉で、G4dnインスタンスとG5インスタンスの

演算能力の差、台帳の詳細、さらには大幅な節約術

徹底的にすっかり明らかにする。

第1段階:ハードウェアと演算能力の分解(G4dnとG5には一体どのような違いがあるのか?)

精算の前に、まず自分がいったいどんな“ロバ”を買ったのかをはっきりさせておく必要があります。G4dnとG5の本質的な違いは、それらが内蔵するものにある

グラフィックカードのアーキテクチャ

違う。

1. Amazon EC2 G4dnインスタンス:コストパフォーマンスに優れた「推論の王者」

統合グラフィックス:NVIDIA T4(Turingアーキテクチャベース)。

ビデオメモリ容量:各カードに16 GBのビデオメモリを搭載。

優位な分野:単精度浮動小数点演算(FP32)の性能は平均的ですが、Tensor Coreをサポートしています。すでに訓練済みのAIモデルによる推論(Inference)、軽量な物体検出、あるいは画質要件が極端でない3Dレンダリングや動画トランスコードに非常に適しています。

平たく言えば、大規模なモデルの訓練がすでに完了し、今後オンラインでユーザーにAPI経由で提供するなら、G4dnを選べば最もコストを抑えられ、投資対効果も最も高い選択です。

2. Amazon EC2 G5インスタンス:全面的に進化した“オールラウンダー”

統合グラフィックス:NVIDIA A10G(Ampereアーキテクチャベース)。

ビデオメモリ容量:各カードあたり24 GB。

優位性のある領域:その演算性能はT4を大きく上回っています。グラフィックスレンダリング性能は最大で3倍に、AIの学習および推論性能は最大で3.3倍に向上しました。高い同時実行性を備えた推論に完璧に対応するだけでなく、メモリ容量が24GBに拡張され演算性能も向上したため、中小型の大規模モデルのファインチューニングや軽量なトレーニングにも利用できるようになりました。

白話: 自分で走って安定したDiffusion XLハイビジョンの絵を描きたいなら、

いくつかのBパラメータのLlama言語モデルを微調整したり、高精度なクラウド3Dリアルタイムレンダリングをしたりすると、より多くのお金を使ってg 5が爽快になる。

第2段階:AWSの3つの主要な課金モデル(月末に請求書がいくらになるかを左右します)

AWSの課金は一律ではなく、まったく異なる3つの利用形態を用意しています。同じサーバーでも、モードを間違えると価格に大きな差が生じる

3〜4倍

モード1:オンデマンドインスタンス――柔軟だが最も高価

課金方法:まさに「使った分だけ支払う」方式で、秒単位で課金されます(最低1分分の料金が発生します)。あなたが借りていないときは、いつでもそれを終わらせることができます。

適用シーン:一時的なコードのデバッグや、数時間程度のテストタスクの実行。

見えない落とし穴:オンデマンドインスタンスを固定サーバーのように常時稼働させてはいけません! G5インスタンスを1カ月間放置したままにしておくと、翌月の料金請求で一気に破産してしまうかもしれません。さらに、オンデマンドインスタンスはリソースの確保が保証されていないため、AIブーム真っただ中の現在、業務のピーク時に「当該ゾーンではGPUを備えたインスタンスを作成できるリソースがありません」という困った状況に直面する可能性があります。

モード2:リザーブドインスタンス(RI)/節約プラン(Savings Plans)――長期安定運用が最もコスト効率的

料金の算定方法:AWSと契約し、当該インスタンスを1年または3年間継続して利用することを約束します。その見返りとして、AWSは直接割引を提供し、1年契約では通常で約40%オフ、3年契約に至っては30~40%オフにもなります。一括払い、月々払い、または前払いなしのいずれかをお選びいただけます。

適用シナリオ:お客様のAIサービスはすでに稼働しており、このサーバーは年間365日・1日24時間、いかなる状況でも停止することなく、堅固に稼働し続けなければなりません。

平たく言えば、このサーバーが毎月半月以上稼働しているなら、節約プランを購入するのが間違いなく最も賢明な選択です。

モード3:スポットインスタンス(入札型インスタンス)――玄人御用達の“お得”獲得ツール

課金方法は?それはAWSの課金体系の中で最も不思議な存在です。AWSは、データセンター内で現在使用されていない“未使用のGPU”をオークションに出品しており、割引率は最大で1〜3割まで下がります(つまり、70%〜90%も節約できるのです)!

致命的な欠点:AWSはいつでもサーバーを強制的に回収する可能性があります。市場でオンデマンドインスタンスの高値買いが相次ぎ、データセンターのGPUが逼迫すると、AWSは2分前に通知を送ったうえで、強制的にサーバーを停止し、回収してしまいます。

適用シーン:分散型の大規模なAIトレーニング、リアルタイムでのオンライン処理を必要としないビデオレンダリングタスク。コード内でチェックポイントによる再開機能を必ず実装しておきましょう。サーバーが突然停止しても、別のマシンに切り替えれば処理を継続できます。

第3段階:G4dnとG5の価格シミュレーション表(計算書をしっかり握ってください)

AWSの世界の異なる地域(Region) での価格は異なる (通常、米国本土で最も安い、中国、日本

ヨーロッパはちょっと高いです。私たちは最も古典的な

米国東部(バージニア州北部)リージョン

公式の標準価格を例として(実際の価格は時間の経過に伴い微調整される場合がありますが、比率は基本的に一定です):

インスタンス名

GPUカードの枚数&モデル

ビデオメモリの総容量

CPUコア/メモリ

オンデマンド単価(1時間あたり)

1年物レート予約換算(毎時)

g4dn.xlarge

NVIDIA T4 1台

16ギガバイト

4コア/16 GB

約0.526ドル

約0.35米ドル(30%以上節約)

g4dn.12xlarge

NVIDIA T4 × 4

64ギガバイト

48コア/192 GB

約3.912ドル

約2.55ドル

g5.xlarge

1個 × NVIDIA A10G

24ギガバイト

4コア/16 GB

約1.006ドル

約0.63米ドル(約40%割引)

g5.12xlarge

NVIDIA A10G × 4

96ギガバイト

48コア/192 GB

約5.672ドル

約3.57ドル

💡帳簿精算の具体例:最も基本的な仕様のg5.xlargeインスタンスを購入して、画像生成やモデルの微調整を実行するとします。オンデマンドモードで1か月間(720時間)常時稼働した場合:1.006 × 720 = 724.32ドル(約人民元5,000元以上)。1年契約の節約プランをご購入の場合、月額は約0.63 × 720 = 453.6ドルとなります。一瞬で人民元にして二千元以上も節約できた。

第4段階:AWSのGPU課金における3つの“見えない吸血鬼”

多くの人は、表に記載された時給1ドルで原価を計算すれば万事がうまくいくと思い込んでいる。結果、請求書を見てみると数百ドルも余計に請求されていました。覚えておいてください。AWSはモジュール式の課金体系であり、GPUサーバーが稼働している間は、以下の3つの箇所でも同時に電力メーターが計測しています。

EBSクラウドディスクの料金(インスタンスを停止しても削除しなければ引き続き課金されます):大規模なモデルを動かすため、Hugging Faceのモデルパラメータを200 GBダウンロードし、300 GBのgp3ディスクを購入しました。注意:EC2インスタンスを停止(Stopped)しても、そのインスタンスを完全に終了(Terminated)していない限り、300 GBのストレージに対して毎日継続してストレージ料金が課金されます! (米国東部では、300GBのハードディスクが月額約24ドルです)。

パブリックネットワークの送信データ転送料金(Data Transfer Out):AWSでは、データの受信(オンプレミスからサーバーへのアップロード)は無料ですが、データの送出(サーバーからお客様のオンプレミスやクライアントへのダウンロード)には料金が発生します。GPUを使って大量の超高精細ビデオをレンダリングしたり、高周波呼び出しをしたりします。

大モデルは大量のテキストを吐き出し、パブリックネットワークのトラフィックが100 GBを超えると、1 GBあたり約0.10ドルのトラフィック料金が請求される。

EIP(Elastic IPアドレス)の未使用料金(停止時には必ずEIPを保持しないでください):サーバーに固定のEIP(Elastic IPアドレス)を割り当てている場合。サーバーが開いているとき、このIPは無料で使えます例えば、サーバーをシャットダウンすると、このIPはアイドル状態になりますAWSは1時間に約0.5% の処罰的なアイドル料金を請求して、貴重なパブリックネットワークIPリソースを占有しないようにします。

まとめと失敗回避の口訣

Amazon CloudのGPUサーバーを管理することは、本質的には、性能要件と予算の間で動的なバランスを取る作業にほかならない。最後に、ベテランがよく使う護身の四つの口訣を贈ります:

軽量な推論にはG4を推奨:既に訓練済みのモデルを小規模に本番稼働させる場合、T4 GPUが最もコスト効率に優れます。

G5での微調整レンダリング:24GBの大容量メモリとAmpereアーキテクチャ。画像生成の微調整ならA10Gが最も快適な体験を提供します。

長期間は購入プラン、短期運用にはオンデマンド:サーバーの稼働時間が毎日12時間を超える限り、必ずSavings Plansを導入します。

退社時には必ず完全に切断する:実験が終わったら、電源を切るだけでなく、HDDやIPアドレスの確認も忘れずに行い、不要なマシンは迷わず終了(Terminate)してください。

1
← 返回新闻中心