無料お役立ち資料はコチラから!

Gemini APIの料金はいくら?無料枠・単価・モデル選びを公式ベースで整理【2026年5月版】

「Gemini APIを使いたいけど、気づいたら高額請求が来そうで怖い」「無料で試せると聞いたのに、どこから課金が始まるのかよくわからない」

その不安は正当です。モデルの種類が増え、無料枠の条件も変わっているので、整理しないまま使い始めると「なぜこの金額になったのか」が後からわかりにくくなります。

Gemini APIはBilling(有料化)を設定しない限り、課金されません。 まず無料で動かして、本番が必要になってから有料化する——この順番で進めれば、想定外の請求は防げます。どのモデルが無料対象かは後述しますが、迷ったら最初は Flash-Liteの無料枠から始めることをおすすめします

この記事で分かること

プロフィール画像

監修者 三上 功太 / アドネス株式会社 代表取締役

本質のSNSマーケター みかみ“として
2020年からSNSで活動を開始

現在はアドネス株式会社 代表取締役として、
300名以上のメンバーを束ねる

教育のDXを実現し、累計生徒数5,000名を突破した
スキル習得プログラム「スキルプラス」を運営

最新AIを活用し、組織マネジメントに特化したサービス
VisionToDo」を独自開発

SNS総フォロワー数は30万人を突破し、
Abemaや、朝日新聞、テレビなど多数のメディアに掲載

渋谷新宿など主要駅でブランド広告を配信

▼ 2025-2026年の主な実績

  • Amazonランキング1位獲得
    (2026/1発売 新著『賢く生きる習慣』)
  • 特許を2件取得
    (教育の属人性を解消する動的カリキュラム技術)
  • 東京大学・大阪教育大学にて特別講義
  • 東北大学医学部と共同研究を開始
  • 堀江貴文氏とラジオ対談出演 (CROSS FM)
  • 渋谷・新宿・JR西日本にてブランド広告ジャック
目次

結局、私はいくら払う?3行で分かる早見表

やりたいこと月額目安モデル
まず無料で試したい$0Flash-Lite(無料枠)
チャットボットを作りたい$10〜$203 Flash
精度が必要な業務処理$50〜3.1 Pro Preview

※ 上記は月1万リクエスト・日本語・短い往復を前提とした目安です。詳しい試算はこちら

課金は「Billingを有効にしたとき」から始まる

Billing(有料化)を有効にしていない状態でAPIを使っている限り、請求はゼロです。

無料お試し期間のサブスクリプションをイメージしてください。カードを登録して「アップグレード」ボタンを押すまで、料金は発生しません。

課金の境界

  • 課金が発生しない
    ➡︎ Billing未設定(Free Tier)でAPIを使う
  • 課金が発生する
    ➡︎BillingをAPIキーのプロジェクトに有効化した状態でリクエストを送る
  • 課金の単位
    ➡︎送ったテキスト(入力トークン)+返ってきたテキスト(出力トークン)

Free TierとPaid Tierの主な違い

Free Tier(無料)

  • 費用:かからない
  • 使えるモデル:一部のみ(Flash・Flash-Lite系が中心)
  • リクエスト数:少ない(開発・試作向け)
  • データの扱い:Googleの製品改善に使われる場合がある

Paid Tier(有料)

  • 費用:トークン数に応じた従量課金
  • 使えるモデル:全モデル(Pro含む)
  • リクエスト数:多い(本番向け)
  • データの扱い:製品改善には使われない

参照:Gemini Developer API pricing / データ利用の詳細は利用規約


「トークン」とは何か|料金の計算単位を理解する

料金は「100万トークンあたりXドル($/1M tokens)」という単位で決まります。入力と出力で単価が違います。

トークンとは、AIがテキストを処理するときの単位です。「単語のかたまり」をイメージすると分かりやすいです。日本語は1文字あたり1〜2トークンになることが多く、英語の同じ意味の文より1.5〜2倍のトークン数になりがちです。「日本語だとコストが上がる」と言われる理由はここにあります。

コストに関わる主な要素

  • 入力トークン| 自分が送ったプロンプト・システム指示・画像やPDFの換算量
  • 出力トークン| AIが返した応答のトークン数(Thinkingトークン含む)
  • プロンプトが200,000トークンを超えると|3.1 Pro Preview など一部モデルは単価が約2倍になる

重要
出力トークンの単価は入力より高い。 ほぼすべてのモデルで出力のほうが割高です。長い返答を返し続けるチャットボットは、気づかないうちにコストが積み上がります。

主要モデルの料金比較(2026年5月時点)

数値は Gemini Developer API pricing に基づきます。価格はUSD。改定される場合があります。

Flash系(コスト重視)

モデル入力出力無料枠
Gemini 3.1 Flash-Lite$0.25$1.50あり
Gemini 3 Flash Preview$0.50$3.00あり(制限付き)
Gemini 2.5 Flash$0.30$2.50要確認※

Pro系(精度重視)

モデル入力(≤200k)出力入力(>200k)出力(>200k)無料枠
Gemini 2.5 Pro$1.25$10.00$2.50$15.00要確認※
Gemini 3.1 Pro Preview$2.00$12.00$4.00$18.00なし

※ 2.5系の無料枠は公式ページの各モデル表「Free Tier」列で確認してください。時点によって変わります。

  • 音声入力は別単価(Flash-Lite: $0.50/1M)
  • Batch API(急がない処理の一括送信)は上記の50%割引
  • Gemini 2.0 Flash・2.0 Flash-Liteは2026年6月1日に廃止予定。まだ使っている場合は移行が必要です

この表のポイント

Flash-Liteが最安ですが「安ければ何でもいい」わけではありません。たとえばFlash-Liteで月1万回・出力500トークンのチャットをすると、出力コストだけで約$7.50。Proなら同じ条件で$60超になります。用途に合わないモデルを選ぶと、品質もコストも両方損します。


無料枠(Free Tier)の現状

Flash-Liteから始めてください。無料で動かせて、コストの感覚もつかめます。

2026年5月時点で確認できる状況

モデル無料枠
Gemini 3.1 Flash-Liteあり(無料で使える)
Gemini 3 Flash Previewあり(制限付き)
Gemini 2.5 Pro / 2.5 Flash公式ページで要確認
Gemini 3.1 Pro Previewなし

2.5系の無料枠は公式の記載が変化しています。本記事では断定せず、公式料金ページの各モデルのFree Tier列を直接確認することを推奨します。

「無料=使い放題」ではない

Free Tierには上限(RPM:毎分リクエスト数、RPD:日次リクエスト数)があります。上限を超えると429エラーが返ってきてAPIが止まります。水道の貯水タンクが空になったら水が出なくなるのと同じです。課金されないのではなく、「そこで止まる」が正確な理解です。

実際の上限値はモデルとプロジェクトの状態によって変わるため、AI Studio Rate limitsの画面で確認してください。


レート制限とコスト上限の設定

正しく課金設定していても、「リクエストを出しすぎる」とAPIは止まります。これがレート制限です。

主なレート制限の種類

  • RPM(毎分リクエスト数)| 1分間に送れるリクエスト数の上限
  • TPM(毎分トークン数)|1分間に処理できるトークン数の上限
  • RPD(日次リクエスト数)|1日のリクエスト数上限(Free Tierで特に厳しい)

Paid Tierに切り替えたら最初にやること

Spend Cap(支出上限)を設定してください 設定しないまま大量リクエストを送ると、想定外の請求になります。

  • Tier 1(初期Paid Tier)にはデフォルトで月$250のBilling tier capが設定されています
  • プロジェクト単位の上限は AI Studio(aistudio.google.com/billing) から確認・変更できます
  • Billing tier cap(アカウント全体)とプロジェクト単位のSpend capは別の仕組みです

参照|ai.google.dev/gemini-api/docs/billing

月額コストの目安を出す

以下は計算例です。実際のコストは利用パターンによって変わります。前提を自分の用途に置き換えて試算してください。

試算の考え方はシンプルです。「月に何トークン使うか」×「単価」、それだけです。

ケースA|日本語チャットボット(短い往復)

  • 前提:入力500・出力500トークン、月1万リクエスト、Gemini 3 Flash
  • 目安:約 月$17.50
  • 入力と出力が同量でも、出力単価が6倍なので出力がコストを支配します

ケースB|PDF要約・長文処理(入力が長い)

  • 前提:入力3,000・出力500トークン、月5,000件、Gemini 3 Flash
  • 目安:約 月$15.00
  • 入力が長いケースはFlash-Liteへ変えると入力コストが半分以下になります

ケースC|高精度な業務処理(Proモデル)

  • 前提:入力1,000・出力2,000トークン、月2,000リクエスト、Gemini 3.1 Pro Preview
  • 目安:約 月$52.00
  • 出力2,000トークン×$12という出力の重さが際立ちます。まずFlashで品質を確認してからProに切り替えるのが無駄のない手順です

用途別|料金から見たモデルの選び方

迷ったらFlash-Liteで始めてください。精度が足りなければFlashへ、それでも足りなければ初めてProを検討する。この順番が最もコストを無駄にしません。

最初からProを選ぶのは、レストランで全メニューを注文してから食べるものを決めるようなものです。

Flash-Liteがおすすめ(まず試す・コスト最優先)

  • 大量のテキスト分類・フィルタリング
  • 翻訳・データ整形など単純処理
  • 個人の検証・プロトタイプ
  • ➡︎出力が短いので出力コストが小さく、単純タスクなら品質も十分です

Flashがおすすめ(バランス型・本番チャット向け)

  • 日本語チャットボット(一般向け)
  • 長文の要約・ドキュメント処理
  • コード生成・デバッグ(まずここから)
  • ➡︎品質とコストのバランスが良い。返答が長くなるほど出力コストが積むので注意

Proを検討するシグナル(精度が直接リスクに直結する場面)

  • 法律・医療・財務など、ミスが許されない処理
  • Flashで試したが精度が明らかに不足していた
  • 1リクエストで200,000トークン以上の入力が必要
  • ➡︎高コスト。Batch API(50%割引)を使うか、ProとFlashを処理によって使い分けるのが現実的です

Gemini APIを「使う側」から「稼ぐ側」へ

モデルの選び方・コストの感覚がついたら、次のステップは「生成AIを業務や仕事に活かすこと」です。以下の無料プレゼントを受け取ると、API活用の先にある実践的なスキルが手に入ります

🎁 生成AIにネタ出しから文章作成まで任せる手順を公開。投稿時間が半分以下になる『投稿の型を10秒で作る時短術』

LINE登録して無料プレゼントを受け取る

【手順
①上記ボタンをクリック➡︎②「スキルプラス公式LINE」が開く➡︎③「追加」を押すだけ(30秒)

※記事の続きを読んでからでもOK
※30秒で無料で登録完了!いつでもブロックOK

ハマりやすい落とし穴

① Developer APIとVertex AIを混同する

GeminiのAPIには「Developer API(ai.google.dev系)」と「Vertex AI経由(Google Cloud)」の2系統があり、料金ページが別です。 個人・スタートアップはほぼDeveloper API、大規模エンタープライズはVertex AI経由になりますが、単価・機能・SLAが異なります。「公式で確認した」つもりでも、どちらを見ていたかで数値が食い違います。

② 古いモデルの料金でそのまま設計する

Geminiはモデルの更新サイクルが速いです。Gemini 2.0 Flash・2.0 Flash-Liteは2026年6月1日に廃止予定。古い記事の数値をそのまま使うと突然APIが動かなくなります。

2026年3〜4月は2つの別々の変更があり混同しやすいので整理しておきます:

  • 3月23日〜: BillingプランがPrepay/Postpayに整理。新規アカウントはPrepay(最低$10の前払い)が基本
  • 4月1日〜: Billing tier cap(Tier 1 = $250)の強制適用が始まった。Free Tierのモデル制限とは別の変更です

③ Thinkingトークンで試算が狂う

2.5 Pro・3.1 Pro Previewなどの推論モデルは「Thinkingトークン」が出力トークンに含まれます。AIが「内部で考えた量」もカウントされるため、見えている応答テキストより実際の出力トークン数が多くなります。 試算より請求が高くなる原因の一つです。

④ Free Tierで機密データを送る

Free Tierのプロンプト・レスポンスはGoogleの製品改善に使用される場合があります(利用規約参照)。個人情報・機密情報を含むプロンプトはFree Tierで送るべきではありません。業務利用はPaid Tierへ移行してから始めてください。

よくある質問(FAQ)

Q. カードを登録しただけで課金されますか?
課金されません。Billingを有効化した状態でAPIリクエストを実際に送ったときに課金が始まります。ただしSpend Capを設定しないまま大量リクエストを送ると、想定外の請求になることがあります。

Q. 日本語は英語よりトークン数が多くなりますか?
なりやすいです。英語の同じ意味の文と比べて1.5〜2倍になるケースが多いです。試算は多めに見積もることを推奨します。

Q. Batch APIとは何ですか?
急がないリクエストをまとめて処理する機能です。料金が50%割引になります。夜間バッチ・大量文書処理など、リアルタイム性が不要な処理には積極的に使うべきです。

Q. Free TierからPaid Tierへの切り替えはすぐにできますか?
AI StudioからBillingを有効化すれば即座に切り替わります。ダウンタイムはありません。


まとめ

  • まずFlash-Liteの無料枠から始める。 課金はBilling有効化まで発生しない
  • 出力トークンがコストの主役。 長い返答を出すほど積み上がる
  • 選び方の順番: Flash-Lite → Flash → Pro の順で試す
  • Spend Capは必ず設定する。 Billing有効化と同時に
  • 2.5系モデルの無料枠は公式ページで要確認。 Flash-Liteは無料で使える

生成AIを「知っている人」から「稼げる人」に変える5つの無料プレゼント

Gemini APIの料金体系が分かったら、次は「生成AIをどう仕事に使うか」です。

APIを使いこなした先に、SNS運用代行・コンテンツ制作の効率化・副業化というルートがあります。LINEに登録するだけで、そこへ進むための5つの教材を無料で受け取れます。

🎁 自分の弱点がわかる『簡単チェックシート』
➡︎投稿・プロフィール・導線・ターゲットの4項目を確認するだけで、今すぐ直すべき箇所が1つに絞れます。

🎁 投稿の型を10秒で作る時短術(生成AI入門セミナー)
➡︎ネタ出しから文章作成まで、生成AIに任せる手順を公開。投稿にかかる時間が半分以下になります。

🎁 アルゴリズムの”なぜ”がわかる 本質のSNSマーケ基礎
➡︎「なぜこの投稿は保存されたのか」「なぜリーチが落ちたのか」が構造で分かるようになります。感覚ではなく根拠で投稿を改善できます。

🎁 改善に迷わなくなる SNSマーケ4ステップループ
➡︎次に何をすればいいかを毎回考えなくて済む思考の型です。投稿→分析→改善→次の投稿、の繰り返しが自動化されます。

🎁 学んだスキルを月5〜30万円の仕事にする方法Instagram運用代行の歩き方)
➡︎ 自分のアカウントを育てながら、運用代行として他者のアカウントを受注する具体的なルートを解説します。

LINE登録して無料プレゼントを受け取る

【手順
①上記ボタンをクリック➡︎②「スキルプラス公式LINE」が開く➡︎③「追加」を押すだけ(30秒)

※30秒で無料で登録完了!いつでもブロックOK

本記事の基準日:2026年5月11日。料金・無料枠の数値は改定されることがあります。最新は Gemini Developer API pricing で確認してください。

目次