Precios de modelos IA por API

GPT, Claude, Gemini, DeepSeek, Qwen y modelos abiertos comparados por precio API mediante OpenRouter

Cuanto cuesta usar un modelo por API

Esta tabla compara entrada y salida por un millon de tokens en una fuente comun. Es util para estimar agentes y aplicaciones; no representa el coste de operar GPUs propias.

Precios actuales

USD por 1M de tokens mediante OpenRouter, ordenado por precio de salida

Actualizado cada 24h May 23, 2026 15:08
# Modelo Pais Entrada Salida
  • 1
    GPT-5.5 Pro
    EE. UU. $30.00 $180.00
  • 2
    Claude Opus 4.7 Fast
    EE. UU. $30.00 $150.00
  • 3
    GPT-5.5
    EE. UU. $5.00 $30.00
  • 4
    Claude Opus 4.7
    EE. UU. $5.00 $25.00
  • 5
    Claude Sonnet 4.6
    EE. UU. $3.00 $15.00
  • 6
    Gemini 3.1 Pro
    EE. UU. $2.00 $12.00
  • 7
    Command A
    Canada $2.50 $10.00
  • 8
    Gemini 3.5 Flash
    EE. UU. $1.50 $9.00
  • 9
    Qwen3.7 Max
    China $2.50 $7.50
  • 10
    Mistral Medium 3.5
    Francia $1.50 $7.50
  • 11
    GPT-5.4 Mini
    EE. UU. $0.75 $4.50
  • 12
    Kimi K2.6
    China $0.73 $3.49
  • 13
    GLM-5.1
    China $0.98 $3.08
  • 14
    Grok 4.3
    EE. UU. $1.25 $2.50
  • 15
    Grok 4.20
    EE. UU. $1.25 $2.50
  • 16
    Qwen3.5 Plus
    China $0.30 $1.80
  • 17
    DeepSeek V4 Pro
    China $0.44 $0.87
  • 18
    Llama 4 Maverick
    EE. UU. $0.15 $0.60
  • 19
    Mistral Small
    Francia $0.15 $0.60
  • 20
    DeepSeek V4 Flash
    China $0.10 $0.20
Fuente: OpenRouter Models API Los modelos visibles se administran desde WordPress

Preguntas sobre precios de modelos IA

Que significa el precio por un millon de tokens

Es el coste de procesar un millon de tokens de entrada o generar un millon de tokens de salida mediante la API disponible en OpenRouter.

Por que la salida suele costar mas

Generar texto exige mas computo que leer contexto, por eso muchos proveedores aplican un precio mayor a los tokens de salida.

Estos precios son del proveedor directo

La tabla muestra precios publicados mediante OpenRouter, una fuente comun para comparar modelos disponibles por API.

Esto mide el coste de servir un modelo en mi GPU

No. Servir un modelo propio implica GPU, energia, memoria, almacenamiento y operacion; es un calculo diferente al precio API.