#ビジネス2025.08.20

【2025年8月最新】API課金・料金早見表＆自動計算ツール ─ OpenAI・Claude・Geminiのトークン単価が秒でわかる

API料金の概算を出すための2つの計算ツールを提供し、最新の価格表や割引メカニズムを整理。トークンの概念やAPIの基本、料金計算の方法、割引の仕組みを解説し、見積精度を高めるためのコツも紹介。商談をスムーズに進めるための情報が満載。

はじめに

営業の現場では――

「API 料金をその場でざっくり出したい」

「モデルを変えるとコストがどれくらい動くのかイメージできない」

といった声が絶えません。そこで「トークン数を入力する」または「コピペする」で概算を出せる 2 つの計算ツール を用意しました。本記事ではツールの使い方と合わせて 最新価格の整理、そして 料金を大幅に下げられる割引メカニズム までまとめます。

⚠️ ご注意

この記事でわかること

API 料金の基本式（入力＋出力）
トークンとは？ ― 文字数 ≠ トークン数
自動計算ツールでAPI料金見積もり
- トークン数入力版：精度を重視する見積もり
- プロンプト入力版：商談中のクイック概算
主要モデルの最新価格表 & 簡易比較
割引が効く 3 つの仕組み（キャッシュ再利用／長文脈しきい値／バッチ API）
見積精度を高めるコツ & FAQ

APIとは何か

“窓口”としての役割

API（Application Programming Interface）は、サービス同士をつなぐ通信の窓口です。RESTやgRPCなど複数のプロトコルがありますが、本記事の主役はHTTP経由のテキストAPI。リクエストを送れば、モデルが推論しレスポンスとしてテキスト（または画像・JSONなど）を返します。

まず基本：料金は「入力トークン＋出力トークン」

合計料金 =（入力トークン数 × 入力単価）＋（出力トークン数 × 出力単価）

課金対象	説明
入力	プロンプトやシステムメッセージなど、モデルに渡すテキスト
出力	モデルが生成するレスポンス

⚠️ **単価は固定ではありません。後述のキャッシュ再利用 / 長文脈しきい値 / バッチ API**に該当すると、最大 90 %（Gemini 系は 75 %）引きになるケースもあります。

トークンとは？

文字数ではない課金単位

OpenAIやAnthropicの言語モデルは、テキストを細かい断片＝トークンで扱います。1トークンは英単語なら≒4文字、日本語では語彙や句読点でばらつきが大きく、同じ100文字でもトークン数は言語で変動します。詳しくはOpenAIのトークナイザー解説が参考になります。(OpenAI)

ざっくり換算

日本語：文字数 ≒ トークン数

英語：単語数 ≒ トークン数

トークナイザー

以下のツールを使用すると、テキストが言語モデルによってどのようにトークン化されるか、およびそのテキスト内のトークンの合計数を把握できます。

platform.openai.com

リンク先の情報を読み込み中...

API料金を自動で計算する

※どちらも 概算ツール であり、厳密な内訳チェックは公式ドキュメントをご参照ください。

トークン数入力版（精度重視）

モデルを選択する
入力トークン数と出力トークン数を入力する
料金が自動計算される

🔍 トークン数の測り方：OpenAI Tokenizer 等で確認すると誤差を小さくできます。

dify-demo.elc-ai.com

リンク先の情報を読み込み中...

プロンプト入力版（クイック概算）

モデルを選択する
入力したいテキストを「プロンプト」に入力
想定される出力を入力
料金が自動計算される

※「日本語：文字数 ≒ トークン数」で計算しているため、コストを少し多めに見積もった概算となります。正確な料金を知りたい場合は、「トークン数入力版」をご使用ください。

dify-demo.elc-ai.com

リンク先の情報を読み込み中...

これらのツールは、Difyでできることの「ほんの一部」です。さらに高度な「自社専用AI」も構築可能です。

計算ツールだけでなく、社内DBと連携した高度なRAGや複雑な自動化ワークフローなど、セキュアな自社専用AIの構築ならElcamyにご相談ください。

elcamy.com

リンク先の情報を読み込み中...

主要モデルの最新API単価・特徴一覧（2025年8月時点）

プロバイダー	モデル	入力（100万トークン）	出力（100万トークン）	最大文脈長	特徴（かんたん概要）
OpenAI	GPT-5	$1.25	$10.00	400 K	旗艦モデル
テキスト＋画像対応／最高精度の推論・コーディング・エージェントタスク向け
	GPT-5 Mini	$0.25	$2.00	400 K	GPT-5 の高速・低コスト版
業務オートメーションや量産タスクに好適
	GPT-5 Nano	$0.05	$0.40	400 K	最軽量
要約・分類など大量リクエスト向け
	o3	$2.00	$8.00	200 K	GPT-4 系後継の“思考特化”モデル
複雑な段階推論・長対話に強い
	o3-pro	$20.00	$80.00	200 K	o3 の演算 10×
法務／金融など高精度エンタープライズ用途
	GPT-4o	$2.50	$10.00	128 K	リアルタイム音声・画像・テキストを高速統合
低レイテンシ
	GPT-4o mini	$0.15	$0.60	128 K	GPT-4o の廉価版
チャットボットや FAQ に向く
Anthropic	Claude Opus 4.1	$15.00	$75.00	200 K	Anthropic 最上位
Constitutional AI で厳密・安全
	Claude Sonnet 4	$3.00	$15.00	1 M	バランス型
1 M トークンβ公開で長大ドキュメント解析◎
	Claude Haiku 3.5	$0.80	$4.00	200 K	超高速・低コスト
要約／簡易 QA に最適
Google Cloud	Gemini 2.5 Pro	$1.25	$10.00	1 M	ネイティブ多モーダル
思考バジェット付き／深い解析向け
	Gemini 2.5 Flash	$0.30	$2.50	1 M	スピード重視ハイブリッド
高スループット＋長文脈
	Gemini 2.5 Flash-Lite	$0.10	$0.40	1 M	最高コスパ
大規模バッチ・自動処理に◎

📍公式サイト：OpenAI , Anthropic , Google Cloud

※AnthropicのPrompt Cachingを利用すると、Opus 4.1 は入力価格の90%オフで再利用可能です。(Anthropic) ※Sonnet 4の β 版 1 M 文脈では入力 $6 / 出力 $22.5に倍増します。 ※Gemini 2.5 Proでは200 K を超えると入力 $2.50 / 出力 $15.00に切り替わります。(Google AI for Developers)

割引になるケース

単価は固定ではなく、リクエストの送り方などによって “最大 90％ OFF” まで変動 します。 「同じ入力が多いか」「リアルタイム性が要るか」「長文かどうか」 の 3 つを軸にワークロードを整理すると、割引を最大化しやすくなります。

キャッシュ再利用・長文脈しきい値・バッチ APIとは？

用語	どういう仕組み？	どんな割引になる？	代表的な条件	向いているケース
キャッシュ再利用(Prompt / Context Caching)	同じ入力をもう一度送ったときに、前回の結果を流用。
モデルには“差分”だけ渡すので入力分がほぼタダ。	入力料金が最大 90 %OFF	- OpenAI Cached Input（GPT-5 系）

Anthropic Prompt Caching
Google Context Caching | FAQ・ABテスト・リトライ処理 | | 長文脈しきい値 | モデルごとに設定されたトークン数の境界を超えると、自動的に“高いレーン”へ切り替わる段階課金。 | 境界を超えた部分だけ 単価アップ | 例：Gemini 2.5 Pro は 200k まで通常、超えると入力 $2.50／出力 $15.00 | 会議録・大型レポートの解析 | | バッチ API / Batch Mode | リアルタイム性が要らない大量リクエストを、まとめて夜間などに処理。サーバーの空き時間を活用できる。 | 入力も出力も最大 50 %OFF | - OpenAI Batch API
Claude Batch Processing
Gemini Batch Mode | ログの一括要約・夜間ジョブ |

見積精度を上げる 4 つのコツ

やること	ひとことで言うと	具体例・なぜ大事？
① 公式トークナイザーで数える	まずは正しいトークン数を確認	公式ツール（OpenAI / Claude / Gemini）でプロンプトを貼り付け → 数字をメモ。
これだけで見積もり誤差がほぼ消えます。
② キャッシュ再利用を設計に組む	同じ入力は“使い回し”	FAQ や AB テストのように同じプロンプトを何度も送るなら「キャッシュ再利用」を ON。
入力料金が最大 90 %OFF になります。
③ 長文しきい値をまたがない	200 K を超えると単価急騰	例：Gemini Pro は 200 K 超から入力単価が 2 倍。
大きな文書は章ごとに分割して送ると安く済みます。
④ バッチ API を夜に流す	“急がない大量処理”はまとめ送り	昼間は見積もりだけ、深夜にバッチ API で一括実行。
入出力とも最大 50 %OFF。
ログ集計や大量分類と相性抜群。

FAQ

Q	A
Dify・GPTs 経由だと請求先は？	呼び出し API キーの所有者へ課金されます。
社内ツールに組み込む場合は管理キーと個人キーを分ける運用が安全です。
日本語だと誤差が大きい？	文字数÷3〜4 が経験則。
業務で厳密に積算する場合はトークン数入力版＋公式トークナイザー併用が必須。
モデル自動切替は有効？	FAQ・チャット → Flash／Nano
精密レポート → GPT-5／Opus
など、品質・速度・コストの三軸最適化が可能。

まとめ ― 5 つだけ押さえれば OK

覚える公式は 1 行だけ
- 料金＝入力トークン料＋出力トークン料
見積もりツールは 2 つを使い分け
- トークン数入力版 → 正確に出したいとき
- プロンプト入力版 → 商談中のその場チェック
割引のカギは 3 つ
- キャッシュ再利用：同じ入力なら 最大 90 %OFF
- バッチ API：急がない大量処理は 最大 50 %OFF
- 長文しきい値：200 K などの境界を超えると単価アップ
タスク別にモデルを自動切替
- 例）FAQ → Flash／Nano、精密レポート → GPT-5／Opus
- 品質とコストのベストバランスが取れる
最後は公式ドキュメントで再確認
- 価格・制限は日々更新
- キャッシュ／バッチ／しきい値を組み合わせて “最小コスト・最大効果” を狙おう

用語・サービスリンク

Token（トークン） – OpenAI Tokenizer 解説 (OpenAI)
GPT-5 公式ページ – OpenAI (OpenAI)
o3 公式ドキュメント – OpenAI (OpenAI)
Claude 4 価格表 – Anthropic (Anthropic)
Gemini 2.5 Pro/Flash 価格 – Google Vertex AI (Google Cloud)

この記事が、商談をスピーディに進めたい営業担当の皆さまの一助となれば幸いです。

さらに自社案件での具体的な試算や実装サポートが必要な場合は、ぜひ Elcamy までお気軽にお問い合わせください。

記事一覧を見る