Elcamy
ブログ一覧に戻る
#ビジネス2025.08.20

【2025年8月最新】API課金・料金早見表&自動計算ツール ─ OpenAI・Claude・Geminiのトークン単価が秒でわかる

API料金の概算を出すための2つの計算ツールを提供し、最新の価格表や割引メカニズムを整理。トークンの概念やAPIの基本、料金計算の方法、割引の仕組みを解説し、見積精度を高めるためのコツも紹介。商談をスムーズに進めるための情報が満載。


はじめに

営業の現場では――

「API 料金をその場でざっくり出したい」

「モデルを変えるとコストがどれくらい動くのかイメージできない」

といった声が絶えません。そこで 「トークン数を入力する」または「コピペする」で概算を出せる 2 つの計算ツール を用意しました。本記事ではツールの使い方と合わせて 最新価格の整理、そして 料金を大幅に下げられる割引メカニズム までまとめます。

⚠️ ご注意

この記事でわかること

  • API 料金の基本式(入力+出力)
  • トークンとは? ― 文字数 ≠ トークン数
  • 自動計算ツールでAPI料金見積もり
    • トークン数入力版:精度を重視する見積もり
    • プロンプト入力版:商談中のクイック概算
  • 主要モデルの最新価格表 & 簡易比較
  • 割引が効く 3 つの仕組み(キャッシュ再利用/長文脈しきい値/バッチ API)
  • 見積精度を高めるコツ & FAQ

APIとは何か

“窓口”としての役割

API(Application Programming Interface)は、サービス同士をつなぐ通信の窓口です。RESTやgRPCなど複数のプロトコルがありますが、本記事の主役はHTTP経由のテキストAPI。リクエストを送れば、モデルが推論しレスポンスとしてテキスト(または画像・JSONなど)を返します。

まず基本:料金は「入力トークン+出力トークン」

合計料金 =(入力トークン数 × 入力単価)+(出力トークン数 × 出力単価)

課金対象説明
入力プロンプトやシステムメッセージなど、モデルに渡すテキスト
出力モデルが生成するレスポンス

⚠️ **単価は固定ではありません。後述のキャッシュ再利用 / 長文脈しきい値 / バッチ API**に該当すると、最大 90 %(Gemini 系は 75 %) 引きになるケースもあります。


トークンとは?

文字数ではない課金単位

OpenAIやAnthropicの言語モデルは、テキストを細かい断片=トークンで扱います。1トークンは英単語なら≒4文字、日本語では語彙や句読点でばらつきが大きく、同じ100文字でもトークン数は言語で変動します。詳しくはOpenAIのトークナイザー解説が参考になります。(OpenAI)

ざっくり換算

  • 日本語:文字数 ≒ トークン数
  • 英語:単語数 ≒ トークン数

トークナイザー

以下のツールを使用すると、テキストが言語モデルによってどのようにトークン化されるか、およびそのテキスト内のトークンの合計数を把握できます。


API料金を自動で計算する

※どちらも 概算ツール であり、厳密な内訳チェックは公式ドキュメントをご参照ください。

トークン数入力版(精度重視)

  1. モデルを選択する
  2. 入力トークン数と出力トークン数を入力する
  3. 料金が自動計算される

🔍 トークン数の測り方OpenAI Tokenizer 等で確認すると誤差を小さくできます。

プロンプト入力版(クイック概算)

  1. モデルを選択する
  2. 入力したいテキストを「プロンプト」に入力
  3. 想定される出力を入力
  4. 料金が自動計算される

※「日本語:文字数 ≒ トークン数」で計算しているため、コストを少し多めに見積もった概算となります。正確な料金を知りたい場合は、「トークン数入力版」をご使用ください。

これらのツールは、Difyでできることの「ほんの一部」です。さらに高度な「自社専用AI」も構築可能です。

計算ツールだけでなく、社内DBと連携した高度なRAGや複雑な自動化ワークフローなど、セキュアな自社専用AIの構築ならElcamyにご相談ください。

主要モデルの最新API単価・特徴一覧(2025年8月時点)

プロバイダーモデル入力(100万トークン)出力(100万トークン)最大文脈長特徴(かんたん概要)
OpenAIGPT-5$1.25$10.00400 K旗艦モデル
テキスト+画像対応/最高精度の推論・コーディング・エージェントタスク向け
GPT-5 Mini$0.25$2.00400 KGPT-5 の高速・低コスト版
業務オートメーションや量産タスクに好適
GPT-5 Nano$0.05$0.40400 K最軽量
要約・分類など大量リクエスト向け
o3$2.00$8.00200 KGPT-4 系後継の“思考特化”モデル
複雑な段階推論・長対話に強い
o3-pro$20.00$80.00200 Ko3 の演算 10×
法務/金融など高精度エンタープライズ用途
GPT-4o$2.50$10.00128 Kリアルタイム音声・画像・テキストを高速統合
低レイテンシ
GPT-4o mini$0.15$0.60128 KGPT-4o の廉価版
チャットボットや FAQ に向く
AnthropicClaude Opus 4.1$15.00$75.00200 KAnthropic 最上位
Constitutional AI で厳密・安全
Claude Sonnet 4$3.00$15.001 Mバランス型
1 M トークンβ公開で長大ドキュメント解析◎
Claude Haiku 3.5$0.80$4.00200 K超高速・低コスト
要約/簡易 QA に最適
Google CloudGemini 2.5 Pro$1.25$10.001 Mネイティブ多モーダル
思考バジェット付き/深い解析向け
Gemini 2.5 Flash$0.30$2.501 Mスピード重視ハイブリッド
高スループット+長文脈
Gemini 2.5 Flash-Lite$0.10$0.401 M最高コスパ
大規模バッチ・自動処理に◎

📍公式サイト:OpenAI , Anthropic , Google Cloud

※AnthropicのPrompt Cachingを利用すると、Opus 4.1 は入力価格の90%オフで再利用可能です。(Anthropic) ※Sonnet 4の β 版 1 M 文脈では入力 $6 / 出力 $22.5に倍増します。 ※Gemini 2.5 Proでは200 K を超えると入力 $2.50 / 出力 $15.00に切り替わります。(Google AI for Developers)


割引になるケース

単価は固定ではなく、リクエストの送り方などによって “最大 90% OFF” まで変動 します。 「同じ入力が多いか」「リアルタイム性が要るか」「長文かどうか」 の 3 つを軸にワークロードを整理すると、割引を最大化しやすくなります。

キャッシュ再利用・長文脈しきい値・バッチ APIとは?

用語どういう仕組み?どんな割引になる?代表的な条件向いているケース
キャッシュ再利用(Prompt / Context Caching)同じ入力をもう一度送ったときに、前回の結果を流用。
モデルには“差分”だけ渡すので入力分がほぼタダ。入力料金が最大 90 %OFF- OpenAI Cached Input(GPT-5 系)
  • Anthropic Prompt Caching
  • Google Context Caching | FAQ・ABテスト・リトライ処理 | | 長文脈しきい値 | モデルごとに設定されたトークン数の境界を超えると、自動的に“高いレーン”へ切り替わる段階課金。 | 境界を超えた部分だけ 単価アップ | 例:Gemini 2.5 Pro は 200k まで通常、超えると入力 $2.50/出力 $15.00 | 会議録・大型レポートの解析 | | バッチ API / Batch Mode | リアルタイム性が要らない大量リクエストを、まとめて夜間などに処理。 サーバーの空き時間を活用できる。 | 入力も出力も最大 50 %OFF | - OpenAI Batch API
  • Claude Batch Processing
  • Gemini Batch Mode | ログの一括要約・夜間ジョブ |

見積精度を上げる 4 つのコツ

やることひとことで言うと具体例・なぜ大事?
① 公式トークナイザーで数えるまずは正しいトークン数を確認公式ツール(OpenAI / Claude / Gemini)でプロンプトを貼り付け → 数字をメモ。
これだけで見積もり誤差がほぼ消えます。
② キャッシュ再利用を設計に組む同じ入力は“使い回し”FAQ や AB テストのように同じプロンプトを何度も送るなら「キャッシュ再利用」を ON。
入力料金が 最大 90 %OFF になります。
③ 長文しきい値をまたがない200 K を超えると単価急騰例:Gemini Pro は 200 K 超から入力単価が 2 倍。
大きな文書は章ごとに分割して送ると安く済みます。
④ バッチ API を夜に流す“急がない大量処理”はまとめ送り昼間は見積もりだけ、深夜にバッチ API で一括実行。
入出力とも 最大 50 %OFF
ログ集計や大量分類と相性抜群。

FAQ

QA
Dify・GPTs 経由だと請求先は?呼び出し API キーの所有者へ課金されます。
社内ツールに組み込む場合は管理キーと個人キーを分ける運用が安全です。
日本語だと誤差が大きい?文字数÷3〜4 が経験則。
業務で厳密に積算する場合はトークン数入力版+公式トークナイザー併用が必須。
モデル自動切替は有効?FAQ・チャット → Flash/Nano
精密レポート → GPT-5/Opus
など、品質・速度・コストの三軸最適化が可能。

まとめ ― 5 つだけ押さえれば OK

  1. 覚える公式は 1 行だけ
    • 料金 = 入力トークン料 + 出力トークン料
  2. 見積もりツールは 2 つを使い分け
    • トークン数入力版 → 正確に出したいとき
    • プロンプト入力版 → 商談中のその場チェック
  3. 割引のカギは 3 つ
    • キャッシュ再利用:同じ入力なら 最大 90 %OFF
    • バッチ API:急がない大量処理は 最大 50 %OFF
    • 長文しきい値:200 K などの境界を超えると単価アップ
  4. タスク別にモデルを自動切替
    • 例)FAQ → Flash/Nano、精密レポート → GPT-5/Opus
    • 品質とコストのベストバランスが取れる
  5. 最後は公式ドキュメントで再確認
    • 価格・制限は日々更新
    • キャッシュ/バッチ/しきい値を組み合わせて “最小コスト・最大効果” を狙おう

用語・サービスリンク

  • Token(トークン) – OpenAI Tokenizer 解説 (OpenAI)
  • GPT-5 公式ページ – OpenAI (OpenAI)
  • o3 公式ドキュメント – OpenAI (OpenAI)
  • Claude 4 価格表 – Anthropic (Anthropic)
  • Gemini 2.5 Pro/Flash 価格 – Google Vertex AI (Google Cloud)

この記事が、商談をスピーディに進めたい営業担当の皆さまの一助となれば幸いです。

さらに自社案件での具体的な試算や実装サポートが必要な場合は、ぜひ Elcamy までお気軽にお問い合わせください。