Estos precios son los de cada proveedor directo

La tabla muestra precios publicados mediante OpenRouter. Sirve para comparar consumo por API en una fuente comun y actualizada.

Esto mide el coste de servir un modelo en mi propia GPU

No. Ejecutar un modelo propio implica GPU, energia, memoria, almacenamiento, serving y operacion; es un calculo diferente al precio API por tokens.

Precios de modelos IA por API

Q: Que significa el precio por un millon de tokens

Es el coste de procesar un millon de tokens de entrada o de generar un millon de tokens de salida mediante la API disponible en OpenRouter.

GPT, Claude, Gemini, DeepSeek, Qwen y modelos abiertos comparados por precio API mediante OpenRouter

Cuanto cuesta usar un modelo por API

Esta tabla compara entrada y salida por un millon de tokens en una fuente comun. Es util para estimar agentes y aplicaciones; no representa el coste de operar GPUs propias.

Precios actuales

USD por 1M de tokens mediante OpenRouter, ordenado por precio de salida

Actualizado cada 24h July 8, 2026 01:06

# Modelo Pais Entrada Salida

1
GPT-5.5 Pro
EE. UU. $30.00 $180.00
2
Claude Opus 4.7 Fast
EE. UU. $30.00 $150.00
3
GPT-5.5
EE. UU. $5.00 $30.00
4
Claude Opus 4.7
EE. UU. $5.00 $25.00
5
Claude Sonnet 4.6
EE. UU. $3.00 $15.00
6
Gemini 3.1 Pro
EE. UU. $2.00 $12.00
7
Command A
Canada $2.50 $10.00
8
Gemini 3.5 Flash
EE. UU. $1.50 $9.00
9
Mistral Medium 3.5
Francia $1.50 $7.50
10
GPT-5.4 Mini
EE. UU. $0.75 $4.50
11
Qwen3.7 Max
China $1.25 $3.75
12
Kimi K2.6
China $0.66 $3.41
13
GLM-5.1
China $0.97 $3.04
14
Grok 4.3
EE. UU. $1.25 $2.50
15
Grok 4.20
EE. UU. $1.25 $2.50
16
Qwen3.5 Plus
China $0.30 $1.80
17
DeepSeek V4 Pro
China $0.44 $0.87
18
Llama 4 Maverick
EE. UU. $0.15 $0.60
19
Mistral Small
Francia $0.15 $0.60
20
DeepSeek V4 Flash
China $0.09 $0.18

Preguntas sobre precios de modelos IA

Que significa el precio por un millon de tokens

Es el coste de procesar un millon de tokens de entrada o generar un millon de tokens de salida mediante la API disponible en OpenRouter.

Por que la salida suele costar mas

Generar texto exige mas computo que leer contexto, por eso muchos proveedores aplican un precio mayor a los tokens de salida.

Estos precios son del proveedor directo

La tabla muestra precios publicados mediante OpenRouter, una fuente comun para comparar modelos disponibles por API.

Esto mide el coste de servir un modelo en mi GPU

No. Servir un modelo propio implica GPU, energia, memoria, almacenamiento y operacion; es un calculo diferente al precio API.