2026年4月1日から、Gemini APIのスペンドキャップ(月間課金上限額)が強制的に適用されるようになる。これまで上限額は設定されていたものの実際には機能していなかった。4月以降は上限に達した時点でビリングアカウント全体のAPIリクエストが翌月まで停止される。個人開発者から企業まで、Gemini APIを本番環境で使っている開発者は今すぐ対応が必要だ。
本記事では、今回の変更内容をGoogleの公式発表をもとに整理し、Tier別の上限額、注意すべきポイント、そして具体的な対策手順を解説する。
今回の変更——「あったけど効いていなかった」上限が本物になる
Gemini APIの各利用ティアには以前から月間スペンドキャップ(支出上限)が設定されていた。しかし実態として、この上限はソフトな目安にすぎず、超過しても即座にリクエストが止まることはなかった。
2025年8月、この状態が深刻な問題を引き起こした。Gemini 2.5 Flash の画像生成機能における課金バグで、内部処理トークンが誤って高コストの「画像出力トークン」として計算され、一部の開発者に数万ドル規模の請求が届いた。このインシデントをきっかけに、Googleは課金の透明性向上と上限管理の強化を本格的に進めることになった。
今回の変更はその流れの集大成だ。上限に達した場合、そのビリングアカウントに紐づく全プロジェクトのGemini APIリクエストが翌月1日まで停止される。
4月までの変更タイムライン
| 日付 | 変更内容 |
|---|---|
| 2026年3月16日 | プロジェクト単位のスペンドキャップ(任意設定)が追加。新しい利用ティア(Usage Tier)システムと課金ダッシュボードが公開 |
| 2026年3月23日 | 新規ユーザー向けにプリペイド課金が必須化(最低チャージ額 $10) |
| 2026年4月1日 | ビリングアカウント単位のティアスペンドキャップが強制適用開始 |
| 2026年6月1日 | Gemini 2.0 Flash / 2.0 Flash-Lite が廃止予定 |
Tier別のスペンドキャップと昇格条件
現在のGemini API利用資格は4段階のTierで管理されており、各Tierに月間の上限額が設定されている。
| Tier | 昇格条件 | 月間スペンドキャップ |
|---|---|---|
| 無料 | ビリングアカウント未接続 | $0(課金なし) |
| Tier 1 | ビリングアカウントを接続するだけで自動昇格 | $250/月 |
| Tier 2 | 累計 $100 消費 + 3日経過で自動昇格 | $2,000/月 |
| Tier 3 | 累計 $1,000 消費 + 30日経過で自動昇格 | $20,000〜$100,000+/月 |
個人開発者のほとんどはTier 1に該当する。月 $250 というのは、小規模なアプリやプロトタイプであれば十分な余裕があるように見える。ただし、複数のプロジェクトを1つのビリングアカウントで管理している場合は合算される点に要注意だ。
レート制限(RPM / TPM / RPD)の現状
4月の変更は主にスペンドキャップの強制適用だが、レート制限(1分あたりのリクエスト数 / トークン数 / 1日あたりのリクエスト数)は2025年12月にすでに大幅な変更があった。現時点での主要モデルの制限は以下の通りだ。
無料ティア
| モデル | RPM(分あたり) | TPM(分あたりトークン) | RPD(日あたり) |
|---|---|---|---|
| Gemini 2.5 Pro | 5 | 250,000 | 100 |
| Gemini 2.5 Flash | 10 | 250,000 | 250 |
| Gemini 2.5 Flash-Lite | 15 | 250,000 | 1,000 |
Tier 1(有料)
| モデル | RPM | TPM | RPD |
|---|---|---|---|
| Gemini 2.5 Pro | 150 | 1,000,000 | 1,000〜1,500 |
| Gemini 2.5 Flash | 200〜300 | 1,000,000〜2,000,000 | 1,500 |
| Gemini 2.5 Flash-Lite | 300 | 1,000,000〜2,000,000 | 1,500 |
最新の正確な数値はモデルやプレビュー状態によって変化するため、Google AI公式ドキュメントのレート制限ページで直接確認することを推奨する。
最も影響を受けるのは誰か
1. 複数プロジェクトを1つのビリングアカウントで管理している開発者
スペンドキャップはビリングアカウント単位で適用される。プロジェクトAとプロジェクトBを同じアカウントで管理している場合、合算消費額が上限に達した時点で両方が停止する。プロジェクトごとに個別のビリングアカウントを用意するか、プロジェクト単位のスペンドキャップ(3月16日に追加された機能)を活用したい。
2. トラフィックが予測しにくい本番環境の開発者
ユーザー数の急増やバズによるリクエスト集中が起きた場合、月間上限に想定外のタイミングで到達する可能性がある。Tier 1の $250 は小規模アプリには十分だが、急成長フェーズに入ったプロダクトでは早期にTier 2昇格の条件を満たしておく、または上限引き上げ申請を準備しておくべきだ。
3. Gemini 2.0 Flash / 2.0 Flash-Lite を本番利用中の開発者
スペンドキャップとは別に、Gemini 2.0 Flash と 2.0 Flash-Lite は2026年6月1日に廃止予定だ。4月の変更と合わせてモデルの移行計画も必要になる。移行先は Gemini 2.5 Flash(バランス型)または Gemini 2.5 Flash-Lite(軽量型)が候補になる。
今すぐやるべき5つの対策
1. 現在のティアと消費額を確認する
Google AI Studio にログインし、自分のアカウントのティアと今月の消費額を確認する。意外と把握していない開発者が多い。
2. プロジェクト単位のスペンドキャップを設定する
3月16日に追加されたプロジェクト単位の任意キャップを設定する。プロジェクトAに $100、プロジェクトBに $80 のように割り当てておくと、アカウント全体の停止を防ぎながら個別のコスト管理ができる。
3. 使用量アラートを設定する
Google Cloud の予算アラートを使い、月間消費額が 50% / 80% / 95% に達した時点でメール通知を受け取るよう設定する。早期に気づければ対処できる。
4. 上限引き上げが必要なら申請を準備する
Tier 1の $250 では不足する見込みがある場合は、Google AI Studioから override request(上限引き上げ申請)を提出できる。審査に時間がかかる場合があるため、余裕を持って申請しておきたい。
5. Gemini 2.0 系モデルからの移行を計画する
6月廃止に向けて、Gemini 2.5 系への移行を4〜5月中に完了しておく。APIのエンドポイントとモデル名を変更するだけで動作するケースがほとんどだが、レスポンスの品質や速度に違いが出る場合があるため、テスト環境で十分に検証してから本番適用する。
個人開発者としての所感
私自身、TrainNote や Book Compass のバックエンドで Gemini API を利用している。正直、これまでの「上限はあるが効かない」状態は安心感があった一方、2025年8月の課金バグ問題を見ると、Googleにとっても開発者にとっても不健全な状態だったとは思う。
今回の変更は「透明性と予測可能性を高める」という方向性として理解できる。スペンドキャップが強制適用されることで、予期しない高額請求のリスクは下がる。ただしそのトレードオフとして、上限到達による突然の停止リスクが現実になるため、事前の設定と監視が欠かせない。
個人開発者にとって特に大事なのは「知らなかった」で止まらないことだ。4月1日は来週に迫っている。今日のうちにGoogle AI Studioを開いて自分のアカウント状態を確認しておくことを強くすすめる。