CrossModel

Models · Pricing

Model catalog

Prices are per 1M tokens. Some long-context models use tiered pricing — the rate increases past a threshold.

36 models
Provider
Input
GPT-5.5TextImageText

openai/gpt-5.5

Context
1M
Max output
128K
Input /1M
$ 5.00
>= 272K$ 10.00
Output /1M
$ 30.00
>= 272K$ 45.00
Cache read /1M
$ 0.50
>= 272K$ 1.00
Cache write /1M
$ 5.00
>= 272K$ 10.00
GPT-5.5 ProTextImageText

openai/gpt-5.5-pro

Context
1M
Max output
128K
Input /1M
$ 30.00
>= 272K$ 60.00
Output /1M
$ 180.00
>= 272K$ 270.00
Cache read /1M
$ 30.00
>= 272K$ 60.00
Cache write /1M
$ 30.00
>= 272K$ 60.00
GPT-5.4TextImageText

openai/gpt-5.4

Context
1M
Max output
128K
Input /1M
$ 2.50
>= 272K$ 5.00
Output /1M
$ 15.00
>= 272K$ 22.50
Cache read /1M
$ 0.25
>= 272K$ 0.50
Cache write /1M
$ 2.50
>= 272K$ 5.00
GPT-5.4 MiniTextImageText

openai/gpt-5.4-mini

Context
400K
Max output
128K
Input /1M
$ 0.75
Output /1M
$ 4.50
Cache read /1M
$ 0.075
Cache write /1M
$ 0.75
GPT-5.4 NanoTextImageText

openai/gpt-5.4-nano

Context
400K
Max output
128K
Input /1M
$ 0.20
Output /1M
$ 1.25
Cache read /1M
$ 0.020
Cache write /1M
$ 0.20
GPT-4o MiniTextImageText

openai/gpt-4o-mini

Context
128K
Max output
16K
Input /1M
$ 0.15
Output /1M
$ 0.60
Cache read /1M
$ 0.075
Cache write /1M
$ 0.15
Claude Opus 4.8TextImageText

anthropic/claude-opus-4-8

Context
1M
Max output
128K
Input /1M
$ 5.00
Output /1M
$ 25.00
Cache read /1M
$ 0.50
Cache write /1M
$ 6.25
Claude Opus 4.7TextImageText

anthropic/claude-opus-4-7

Context
1M
Max output
128K
Input /1M
$ 5.00
Output /1M
$ 25.00
Cache read /1M
$ 0.50
Cache write /1M
$ 6.25
Claude Opus 4.6TextImageText

anthropic/claude-opus-4-6

Context
1M
Max output
128K
Input /1M
$ 5.00
Output /1M
$ 25.00
Cache read /1M
$ 0.50
Cache write /1M
$ 6.25
Claude Sonnet 4.6TextImageText

anthropic/claude-sonnet-4-6

Context
1M
Max output
64K
Input /1M
$ 3.00
Output /1M
$ 15.00
Cache read /1M
$ 0.30
Cache write /1M
$ 3.75
Claude Haiku 4.5TextImageText

anthropic/claude-haiku-4-5

Context
200K
Max output
64K
Input /1M
$ 1.00
Output /1M
$ 5.00
Cache read /1M
$ 0.10
Cache write /1M
$ 1.25
Gemini 3 Flash PreviewTextImageAudioVideoText

gemini/gemini-3-flash-preview

Context
1M
Max output
66K
Input /1M
$ 0.50
Output /1M
$ 3.00
Cache read /1M
$ 0.050
Cache write /1M
$ 0.50
Gemini 3.5 FlashTextImageAudioVideoText

gemini/gemini-3.5-flash

Context
1M
Max output
66K
Input /1M
$ 1.50
Output /1M
$ 9.00
Cache read /1M
$ 0.15
Cache write /1M
$ 1.50
Gemini 3.1 Pro PreviewTextImageAudioVideoText

gemini/gemini-3.1-pro-preview

Context
1M
Max output
66K
Input /1M
$ 2.00
>= 200K$ 4.00
Output /1M
$ 12.00
>= 200K$ 18.00
Cache read /1M
$ 0.20
>= 200K$ 0.40
Cache write /1M
$ 2.00
>= 200K$ 4.00
Gemini 2.5 ProTextImageAudioVideoText

gemini/gemini-2.5-pro

Context
1M
Max output
66K
Input /1M
$ 1.25
>= 200K$ 2.50
Output /1M
$ 10.00
>= 200K$ 15.00
Cache read /1M
$ 0.13
>= 200K$ 0.25
Cache write /1M
$ 1.25
>= 200K$ 2.50
Gemini 2.5 FlashTextImageAudioVideoText

gemini/gemini-2.5-flash

Context
1M
Max output
66K
Input /1M
$ 0.30
Output /1M
$ 2.50
Cache read /1M
$ 0.030
Cache write /1M
$ 0.30
Gemini 2.5 Flash LiteTextImageAudioVideoText

gemini/gemini-2.5-flash-lite

Context
1M
Max output
66K
Input /1M
$ 0.10
Output /1M
$ 0.40
Cache read /1M
$ 0.010
Cache write /1M
$ 0.10
Kimi K2.6TextImageVideoText

moonshot/kimi-k2.6

Context
262K
Max output
33K
Input /1M
$ 1.00
Output /1M
$ 4.16
Cache read /1M
$ 0.17
Cache write /1M
$ 1.00
Kimi K2.5TextImageVideoText

moonshot/kimi-k2.5

Context
262K
Max output
33K
Input /1M
$ 0.62
Output /1M
$ 3.24
Cache read /1M
$ 0.11
Cache write /1M
$ 0.62

deepseek/deepseek-v4-flash

Context
1M
Max output
65K
Input /1M
$ 0.16
Output /1M
$ 0.31
Cache read /1M
$ 0.010
Cache write /1M
$ 0.16

deepseek/deepseek-v4-pro

Context
1M
Max output
65K
Input /1M
$ 0.47
Output /1M
$ 0.93
Cache read /1M
$ 0.010
Cache write /1M
$ 0.47
Qwen3.7 MaxTextText

qwen/qwen3.7-max

Context
1M
Max output
66K
Input /1M
$ 1.85
Output /1M
$ 5.54
Cache read /1M
$ 0.37
Cache write /1M
$ 2.31
Qwen3.6 PlusTextImageVideoText

qwen/qwen3.6-plus

Context
1M
Max output
66K
Input /1M
$ 0.31
>= 256K$ 1.24
Output /1M
$ 1.85
>= 256K$ 7.39
Cache read /1M
$ 0.070
>= 256K$ 0.25
Cache write /1M
$ 0.39
>= 256K$ 1.54
Qwen3.6 FlashTextImageVideoText

qwen/qwen3.6-flash

Context
1M
Max output
66K
Input /1M
$ 0.19
Output /1M
$ 1.11
Cache read /1M
$ 0.040
Cache write /1M
$ 0.24
Qwen3.5 FlashTextImageVideoText

qwen/qwen3.5-flash-02-23

Context
1M
Max output
66K
Input /1M
$ 0.040
Output /1M
$ 0.31
Cache read /1M
$ 0.010
Cache write /1M
$ 0.040

xiaomi/mimo-v2.5-pro

Context
1M
Max output
128K
Input /1M
$ 0.47
Output /1M
$ 0.93
Cache read /1M
$ 0.010
Cache write /1M
$ 0.47
MiMo V2.5TextImageText

xiaomi/mimo-v2.5

Context
1M
Max output
128K
Input /1M
$ 0.16
Output /1M
$ 0.31
Cache read /1M
$ 0.010
Cache write /1M
$ 0.16
MiniMax M2.7TextText

minimax/minimax-m2.7

Context
205K
Max output
2K
Input /1M
$ 0.33
Output /1M
$ 1.30
Cache read /1M
$ 0.070
Cache write /1M
$ 0.41
MiniMax M2.5TextText

minimax/minimax-m2.5

Context
205K
Max output
2K
Input /1M
$ 0.33
Output /1M
$ 1.30
Cache read /1M
$ 0.040
Cache write /1M
$ 0.41

minimax/minimax-m2.5-highspeed

Context
205K
Max output
2K
Input /1M
$ 0.65
Output /1M
$ 2.59
Cache read /1M
$ 0.040
Cache write /1M
$ 0.41
GLM-5.1TextText

z-ai/glm-5.1

Context
200K
Max output
128K
Input /1M
$ 0.93
>= 32K$ 1.24
Output /1M
$ 3.70
>= 32K$ 4.31
Cache read /1M
$ 0.20
>= 32K$ 0.31
Cache write /1M
$ 0.93
>= 32K$ 1.24
GLM-5TextText

z-ai/glm-5

Context
200K
Max output
128K
Input /1M
$ 0.62
>= 32K$ 0.93
Output /1M
$ 2.77
>= 32K$ 3.39
Cache read /1M
$ 0.16
>= 32K$ 0.24
Cache write /1M
$ 0.62
>= 32K$ 0.93
GLM-5 TurboTextText

z-ai/glm-5-turbo

Context
200K
Max output
128K
Input /1M
$ 0.77
>= 32K$ 1.08
Output /1M
$ 3.39
>= 32K$ 4.00
Cache read /1M
$ 0.19
>= 32K$ 0.28
Cache write /1M
$ 0.77
>= 32K$ 1.08
GLM-5V TurboTextImageVideoText

z-ai/glm-5v-turbo

Context
200K
Max output
128K
Input /1M
$ 0.77
>= 32K$ 1.08
Output /1M
$ 3.39
>= 32K$ 4.00
Cache read /1M
$ 0.19
>= 32K$ 0.28
Cache write /1M
$ 0.77
>= 32K$ 1.08
GLM-4.7TextText

z-ai/glm-4.7

Context
200K
Max output
128K
Input /1M
$ 0.47
>= 32K$ 0.62
Output /1M
$ 2.16
>= 32K$ 2.47
Cache read /1M
$ 0.10
>= 32K$ 0.13
Cache write /1M
$ 0.47
>= 32K$ 0.62
Hy3 PreviewTextText

tencent/hy3-preview

Context
256K
Max output
128K
Input /1M
$ 0.19
>= 16K$ 0.25
>= 32K$ 0.31
Output /1M
$ 0.62
>= 16K$ 0.99
>= 32K$ 1.24
Cache read /1M
$ 0.070
>= 16K$ 0.10
>= 32K$ 0.13
Cache write /1M
$ 0.19
>= 16K$ 0.25
>= 32K$ 0.31