Gemini APIの料金はいくら？無料枠・単価・モデル選びを公式ベースで整理【2026年5月版】

2026年5月11日2026年5月13日

「Gemini APIを使いたいけど、気づいたら高額請求が来そうで怖い」「無料で試せると聞いたのに、どこから課金が始まるのかよくわからない」

その不安は正当です。モデルの種類が増え、無料枠の条件も変わっているので、整理しないまま使い始めると「なぜこの金額になったのか」が後からわかりにくくなります。

Gemini APIはBilling（有料化）を設定しない限り、課金されません。 まず無料で動かして、本番が必要になってから有料化する——この順番で進めれば、想定外の請求は防げます。どのモデルが無料対象かは後述しますが、迷ったら最初は Flash-Liteの無料枠から始めることをおすすめします。

この記事で分かること

課金が始まる条件（いつ・何に対して課金されるか）
無料で使えるモデルと上限
主要モデルの単価比較
月額コストの目安の出し方
用途別のモデル選び方
ハマりやすい落とし穴

監修者三上功太 / アドネス株式会社代表取締役

“本質のSNSマーケターみかみ“として
2020年からSNSで活動を開始

現在はアドネス株式会社代表取締役として、
300名以上のメンバーを束ねる

教育のDXを実現し、累計生徒数5,000名を突破した
スキル習得プログラム「スキルプラス」を運営

最新AIを活用し、組織マネジメントに特化したサービス
「VisionToDo」を独自開発

SNS総フォロワー数は30万人を突破し、
Abemaや、朝日新聞、テレビなど多数のメディアに掲載

渋谷、新宿など主要駅でブランド広告を配信

▼ 2025-2026年の主な実績

Amazonランキング1位獲得
(2026/1発売新著『賢く生きる習慣』)
特許を2件取得
(教育の属人性を解消する動的カリキュラム技術)
東京大学・大阪教育大学にて特別講義
東北大学医学部と共同研究を開始
堀江貴文氏とラジオ対談出演 (CROSS FM)
渋谷・新宿・JR西日本にてブランド広告ジャック

結局、私はいくら払う？3行で分かる早見表

やりたいこと	月額目安	モデル
まず無料で試したい	$0	Flash-Lite（無料枠）
チャットボットを作りたい	$10〜$20	3 Flash
精度が必要な業務処理	$50〜	3.1 Pro Preview

※ 上記は月1万リクエスト・日本語・短い往復を前提とした目安です。詳しい試算はこちら

課金は「Billingを有効にしたとき」から始まる

Billing（有料化）を有効にしていない状態でAPIを使っている限り、請求はゼロです。

無料お試し期間のサブスクリプションをイメージしてください。カードを登録して「アップグレード」ボタンを押すまで、料金は発生しません。

課金の境界

課金が発生しない
➡︎ Billing未設定（Free Tier）でAPIを使う
課金が発生する
➡︎BillingをAPIキーのプロジェクトに有効化した状態でリクエストを送る
課金の単位
➡︎送ったテキスト（入力トークン）＋返ってきたテキスト（出力トークン）

Free TierとPaid Tierの主な違い

Free Tier（無料）

費用：かからない
使えるモデル：一部のみ（Flash・Flash-Lite系が中心）
リクエスト数：少ない（開発・試作向け）
データの扱い：Googleの製品改善に使われる場合がある

Paid Tier（有料）

費用：トークン数に応じた従量課金
使えるモデル：全モデル（Pro含む）
リクエスト数：多い（本番向け）
データの扱い：製品改善には使われない

参照：Gemini Developer API pricing / データ利用の詳細は利用規約

「トークン」とは何か｜料金の計算単位を理解する

料金は「100万トークンあたりXドル（$/1M tokens）」という単位で決まります。入力と出力で単価が違います。

トークンとは、AIがテキストを処理するときの単位です。「単語のかたまり」をイメージすると分かりやすいです。日本語は1文字あたり1〜2トークンになることが多く、英語の同じ意味の文より1.5〜2倍のトークン数になりがちです。「日本語だとコストが上がる」と言われる理由はここにあります。

コストに関わる主な要素

入力トークン｜自分が送ったプロンプト・システム指示・画像やPDFの換算量
出力トークン｜ AIが返した応答のトークン数（Thinkingトークン含む）
プロンプトが200,000トークンを超えると｜3.1 Pro Preview など一部モデルは単価が約2倍になる

【重要】
出力トークンの単価は入力より高い。 ほぼすべてのモデルで出力のほうが割高です。長い返答を返し続けるチャットボットは、気づかないうちにコストが積み上がります。

主要モデルの料金比較（2026年5月時点）

数値は Gemini Developer API pricing に基づきます。価格はUSD。改定される場合があります。

Flash系（コスト重視）

モデル	入力	出力	無料枠
Gemini 3.1 Flash-Lite	$0.25	$1.50	あり
Gemini 3 Flash Preview	$0.50	$3.00	あり（制限付き）
Gemini 2.5 Flash	$0.30	$2.50	要確認※

Pro系（精度重視）

モデル	入力（≤200k）	出力	入力（>200k）	出力（>200k）	無料枠
Gemini 2.5 Pro	$1.25	$10.00	$2.50	$15.00	要確認※
Gemini 3.1 Pro Preview	$2.00	$12.00	$4.00	$18.00	なし

※ 2.5系の無料枠は公式ページの各モデル表「Free Tier」列で確認してください。時点によって変わります。

音声入力は別単価（Flash-Lite: $0.50/1M）
Batch API（急がない処理の一括送信）は上記の50%割引
Gemini 2.0 Flash・2.0 Flash-Liteは2026年6月1日に廃止予定。まだ使っている場合は移行が必要です

この表のポイント

Flash-Liteが最安ですが「安ければ何でもいい」わけではありません。たとえばFlash-Liteで月1万回・出力500トークンのチャットをすると、出力コストだけで約$7.50。Proなら同じ条件で$60超になります。用途に合わないモデルを選ぶと、品質もコストも両方損します。

無料枠（Free Tier）の現状

Flash-Liteから始めてください。無料で動かせて、コストの感覚もつかめます。

2026年5月時点で確認できる状況

モデル	無料枠
Gemini 3.1 Flash-Lite	あり（無料で使える）
Gemini 3 Flash Preview	あり（制限付き）
Gemini 2.5 Pro / 2.5 Flash	公式ページで要確認
Gemini 3.1 Pro Preview	なし

2.5系の無料枠は公式の記載が変化しています。本記事では断定せず、公式料金ページの各モデルのFree Tier列を直接確認することを推奨します。

「無料＝使い放題」ではない

Free Tierには上限（RPM：毎分リクエスト数、RPD：日次リクエスト数）があります。上限を超えると429エラーが返ってきてAPIが止まります。水道の貯水タンクが空になったら水が出なくなるのと同じです。課金されないのではなく、「そこで止まる」が正確な理解です。

実際の上限値はモデルとプロジェクトの状態によって変わるため、AI Studio Rate limitsの画面で確認してください。

レート制限とコスト上限の設定

正しく課金設定していても、「リクエストを出しすぎる」とAPIは止まります。これがレート制限です。

主なレート制限の種類

RPM（毎分リクエスト数）｜ 1分間に送れるリクエスト数の上限
TPM（毎分トークン数）｜1分間に処理できるトークン数の上限
RPD（日次リクエスト数）｜1日のリクエスト数上限（Free Tierで特に厳しい）

Paid Tierに切り替えたら最初にやること

Spend Cap（支出上限）を設定してください。 設定しないまま大量リクエストを送ると、想定外の請求になります。

Tier 1（初期Paid Tier）にはデフォルトで月$250のBilling tier capが設定されています
プロジェクト単位の上限は AI Studio（aistudio.google.com/billing） から確認・変更できます
Billing tier cap（アカウント全体）とプロジェクト単位のSpend capは別の仕組みです

参照｜ai.google.dev/gemini-api/docs/billing

月額コストの目安を出す

以下は計算例です。実際のコストは利用パターンによって変わります。前提を自分の用途に置き換えて試算してください。

試算の考え方はシンプルです。「月に何トークン使うか」×「単価」、それだけです。

ケースA｜日本語チャットボット（短い往復）

前提：入力500・出力500トークン、月1万リクエスト、Gemini 3 Flash
目安：約 月$17.50
入力と出力が同量でも、出力単価が6倍なので出力がコストを支配します

ケースB｜PDF要約・長文処理（入力が長い）

前提：入力3,000・出力500トークン、月5,000件、Gemini 3 Flash
目安：約 月$15.00
入力が長いケースはFlash-Liteへ変えると入力コストが半分以下になります

ケースC｜高精度な業務処理（Proモデル）

前提：入力1,000・出力2,000トークン、月2,000リクエスト、Gemini 3.1 Pro Preview
目安：約 月$52.00
出力2,000トークン×$12という出力の重さが際立ちます。まずFlashで品質を確認してからProに切り替えるのが無駄のない手順です

用途別｜料金から見たモデルの選び方

迷ったらFlash-Liteで始めてください。精度が足りなければFlashへ、それでも足りなければ初めてProを検討する。この順番が最もコストを無駄にしません。

最初からProを選ぶのは、レストランで全メニューを注文してから食べるものを決めるようなものです。

Flash-Liteがおすすめ（まず試す・コスト最優先）

大量のテキスト分類・フィルタリング
翻訳・データ整形など単純処理
個人の検証・プロトタイプ
➡︎出力が短いので出力コストが小さく、単純タスクなら品質も十分です

Flashがおすすめ（バランス型・本番チャット向け）

日本語チャットボット（一般向け）
長文の要約・ドキュメント処理
コード生成・デバッグ（まずここから）
➡︎品質とコストのバランスが良い。返答が長くなるほど出力コストが積むので注意

Proを検討するシグナル（精度が直接リスクに直結する場面）

法律・医療・財務など、ミスが許されない処理
Flashで試したが精度が明らかに不足していた
1リクエストで200,000トークン以上の入力が必要
➡︎高コスト。Batch API（50%割引）を使うか、ProとFlashを処理によって使い分けるのが現実的です

Gemini APIを「使う側」から「稼ぐ側」へ

モデルの選び方・コストの感覚がついたら、次のステップは「生成AIを業務や仕事に活かすこと」です。以下の無料プレゼントを受け取ると、API活用の先にある実践的なスキルが手に入ります

🎁 生成AIにネタ出しから文章作成まで任せる手順を公開。投稿時間が半分以下になる『投稿の型を10秒で作る時短術』

LINE登録して無料プレゼントを受け取る

【手順】
①上記ボタンをクリック➡︎②「スキルプラス公式LINE」が開く➡︎③「追加」を押すだけ（30秒）

※記事の続きを読んでからでもOK
※30秒で無料で登録完了！いつでもブロックOK

ハマりやすい落とし穴

① Developer APIとVertex AIを混同する

GeminiのAPIには「Developer API（ai.google.dev系）」と「Vertex AI経由（Google Cloud）」の2系統があり、料金ページが別です。 個人・スタートアップはほぼDeveloper API、大規模エンタープライズはVertex AI経由になりますが、単価・機能・SLAが異なります。「公式で確認した」つもりでも、どちらを見ていたかで数値が食い違います。

② 古いモデルの料金でそのまま設計する

Geminiはモデルの更新サイクルが速いです。Gemini 2.0 Flash・2.0 Flash-Liteは2026年6月1日に廃止予定。古い記事の数値をそのまま使うと突然APIが動かなくなります。

2026年3〜4月は2つの別々の変更があり混同しやすいので整理しておきます：

3月23日〜： BillingプランがPrepay/Postpayに整理。新規アカウントはPrepay（最低$10の前払い）が基本
4月1日〜： Billing tier cap（Tier 1 = $250）の強制適用が始まった。Free Tierのモデル制限とは別の変更です

③ Thinkingトークンで試算が狂う

2.5 Pro・3.1 Pro Previewなどの推論モデルは「Thinkingトークン」が出力トークンに含まれます。AIが「内部で考えた量」もカウントされるため、見えている応答テキストより実際の出力トークン数が多くなります。 試算より請求が高くなる原因の一つです。

④ Free Tierで機密データを送る

Free Tierのプロンプト・レスポンスはGoogleの製品改善に使用される場合があります（利用規約参照）。個人情報・機密情報を含むプロンプトはFree Tierで送るべきではありません。業務利用はPaid Tierへ移行してから始めてください。

よくある質問（FAQ）

Q. カードを登録しただけで課金されますか？
課金されません。Billingを有効化した状態でAPIリクエストを実際に送ったときに課金が始まります。ただしSpend Capを設定しないまま大量リクエストを送ると、想定外の請求になることがあります。

Q. 日本語は英語よりトークン数が多くなりますか？
なりやすいです。英語の同じ意味の文と比べて1.5〜2倍になるケースが多いです。試算は多めに見積もることを推奨します。

Q. Batch APIとは何ですか？
急がないリクエストをまとめて処理する機能です。料金が50%割引になります。夜間バッチ・大量文書処理など、リアルタイム性が不要な処理には積極的に使うべきです。

Q. Free TierからPaid Tierへの切り替えはすぐにできますか？
AI StudioからBillingを有効化すれば即座に切り替わります。ダウンタイムはありません。

まとめ

まずFlash-Liteの無料枠から始める。 課金はBilling有効化まで発生しない
出力トークンがコストの主役。 長い返答を出すほど積み上がる
選び方の順番： Flash-Lite → Flash → Pro の順で試す
Spend Capは必ず設定する。 Billing有効化と同時に
2.5系モデルの無料枠は公式ページで要確認。 Flash-Liteは無料で使える

生成AIを「知っている人」から「稼げる人」に変える5つの無料プレゼント

Gemini APIの料金体系が分かったら、次は「生成AIをどう仕事に使うか」です。

APIを使いこなした先に、SNS運用代行・コンテンツ制作の効率化・副業化というルートがあります。LINEに登録するだけで、そこへ進むための5つの教材を無料で受け取れます。

🎁 自分の弱点がわかる『簡単チェックシート』
➡︎投稿・プロフィール・導線・ターゲットの4項目を確認するだけで、今すぐ直すべき箇所が1つに絞れます。

🎁 投稿の型を10秒で作る時短術（生成AI入門セミナー）
➡︎ネタ出しから文章作成まで、生成AIに任せる手順を公開。投稿にかかる時間が半分以下になります。

🎁 アルゴリズムの”なぜ”がわかる本質のSNSマーケ基礎
➡︎「なぜこの投稿は保存されたのか」「なぜリーチが落ちたのか」が構造で分かるようになります。感覚ではなく根拠で投稿を改善できます。

🎁 改善に迷わなくなる SNSマーケ4ステップループ
➡︎次に何をすればいいかを毎回考えなくて済む思考の型です。投稿→分析→改善→次の投稿、の繰り返しが自動化されます。

🎁 学んだスキルを月5〜30万円の仕事にする方法（Instagram運用代行の歩き方）
➡︎ 自分のアカウントを育てながら、運用代行として他者のアカウントを受注する具体的なルートを解説します。