DeepSeek V4 costará el doble en horas pico: lo que debes hacer para no pagar de más

La espera terminó. DeepSeek acaba de confirmar que la versión oficial de su modelo V4 estará disponible a mediados de julio de 2026, y lo hará con un esquema de facturación que rompe la tradición de precios planos que mantuvo durante dos años. A partir del lanzamiento, usar deepseek-v4-pro o deepseek-v4-flash durante el horario comercial de Pekín costará el doble que en el resto del día.

Lo que cambia del preview a la versión oficial

Desde abril, los desarrolladores han estado probando V4 sin saberlo del todo. Los mismos identificadores de modelo que hoy usan (deepseek-v4-pro y deepseek-v4-flash) eran en realidad una preview, no el producto terminado. El anuncio oficial no trae nuevos nombres, pero sí un marco comercial distinto: tarifas diferenciadas por hora del día y las prometidas “optimizaciones de funciones y mejora de rendimiento”.

La nota de DeepSeek, publicada originalmente en chino, habla de 功能优化 (pulido de funciones) y 性能提升 (mejora de rendimiento). Algunos observadores, como el analista Teortaxes, interpretan que no se trata de un salto de inteligencia sino de una puesta a punto de la infraestructura. Sin embargo, la ambigüedad del término 性能提升 deja abierta la posibilidad de una mejora real en los benchmarks. Por ahora no hay tablas nuevas que lo confirmen.

Lo que ya funcionaba se mantiene: contexto de 1 millón de tokens, salida máxima de 384K tokens, modos de pensamiento y compatibilidad con las APIs de OpenAI y Anthropic. Los modelos siguen teniendo pesos abiertos en Hugging Face y las integraciones con agentes como Claude Code.

Así quedan las tarifas con el nuevo esquema

DeepSeek definió dos ventanas como horas pico, ambas en horario de Pekín: de 9:00 a 12:00 y de 14:00 a 18:00. Durante esos bloques, los precios de todos los tokens se multiplican por dos. Fuera de ahí, las tarifas base se mantienen sin cambios con respecto al preview actual.

Estas son las cifras oficiales para el modelo deepseek-v4-pro, en yuanes por millón de tokens:

Entrada (cache hit): 0,025 ¥ en valle / 0,05 ¥ en pico
Entrada (cache miss): 3,00 ¥ en valle / 6,00 ¥ en pico
Salida: 6,00 ¥ en valle / 12,00 ¥ en pico

Y para deepseek-v4-flash:

Entrada (cache hit): 0,02 ¥ en valle / 0,04 ¥ en pico
Entrada (cache miss): 1,00 ¥ en valle / 2,00 ¥ en pico
Salida: 2,00 ¥ en valle / 4,00 ¥ en pico

En dólares, el valle del modelo flash se queda en 0,14 $ por millón de tokens de entrada (sin caché) y 0,28 $ en salida. Incluso con el multiplicador pico, los precios siguen muy por debajo de lo que cobran las APIs de frontera estadounidenses. La documentación oficial de precios ya está disponible en api-docs.deepseek.com.

¿Cuándo pagas el doble? Las horas pico en Pekín

El nuevo sistema golpea distinto según la región del desarrollador. En China, las horas pico coinciden con la jornada laboral. En la costa este de Estados Unidos, los periodos de mayor costo caen entre las 21:00 y las 06:00. Para la costa oeste, en cambio, las ventanas cubren la tarde y parte de la noche, así que resulta más fácil mover trabajos pesados a horas baratas. En Europa, la mañana y primeras horas de la tarde se solapan parcialmente con la banda pico, pero con planificación se puede esquivar.

El comentario de Teortaxes captó la atención de miles de desarrolladores: “Durante el día en China es hora pico. Durante el día en Estados Unidos también es hora pico. Así que no quedan tantas horas baratas”. DeepSeek busca financiar la demanda doméstica, que es justo la que le da ingresos, sin renunciar del todo al atractivo de precio para el resto del mundo.

Cinco pasos para ajustarse al cambio

Los equipos que dependen de las APIs de V4 tienen poco más de una semana para reorganizarse:

Presupuestar con el multiplicador pico. Si los agentes funcionan en horario de Pekín, el costo por token se duplica. Incluso así, los aciertos de caché siguen siendo baratos (0,05 ¥ el millón en Pro).
Mover trabajos por lotes a la noche. Las tareas que no requieren respuesta inmediata (evaluaciones, generación de conjuntos de datos, barridos de embeddings) se pueden programar fuera de las 9:00-12:00 y 14:00-18:00 de China.
Revisar el correo. DeepSeek enviará un aviso 24 horas antes de que las nuevas tarifas entren en vigor para no pillar a nadie desprevenido.
Decidir si seguir o pedir reembolso. Si los nuevos precios no encajan, la política oficial permite dejar de usar el servicio y solicitar la devolución del saldo restante.
Planificar la migración de los IDs heredados. Los alias deepseek-chat y deepseek-reasoner se retirarán el 24 de julio, una fecha independiente del lanzamiento de mediados de mes.

Mientras DeepSeek ajusta sus precios para monetizar la demanda, otras empresas del sector mueven ficha con decisiones radicales. Alibaba ha prohibido el uso de Claude Code entre sus empleados por sospechas de seguridad, un recordatorio de que el ecosistema de la inteligencia artificial vive en tensión constante entre la apertura y el control.

El contexto: DeepSeek en el mercado de modelos abiertos

El lanzamiento oficial de V4 se produce en un mes cargado de movimientos en el código abierto. Modelos como GLM-5.2, Kimi K2.7-Code o LongCat-2.0 compiten por la atención de los desarrolladores, mientras Fable 5 apenas regresa por unos días con muchas limitaciones. DeepSeek ha apostado por cobrar más solo cuando la demanda es alta, sin tocar el precio de la tarifa plana que ya descolocó a sus competidores occidentales a principios de 2026.

La estrategia es simple: cubrir costes en las horas de mayor actividad en China y mantener la ventaja competitiva en el resto del mundo. Incluso al doble, el modelo flash sigue siendo una opción imbatible para bucles de agentes de alto volumen, y Pro cuesta una fracción de lo que piden Claude o GPT por tokens equivalentes. Como resumió Teortaxes, “en cualquier caso, me parece bien, necesitan ingresos”.

DeepSeek V4 costará el doble en horas pico: lo que debes hacer para no pagar de más

Lo que cambia del preview a la versión oficial

Así quedan las tarifas con el nuevo esquema

¿Cuándo pagas el doble? Las horas pico en Pekín

Cinco pasos para ajustarse al cambio

El contexto: DeepSeek en el mercado de modelos abiertos

Redacción Arepa Tecnológica

Comunidad Arepa

Comentarios

Relacionados

Claude Opus 5 llega con inteligencia de frontera a mitad del precio de Fable 5

OpenAI estrena ChatGPT Voice en la app de escritorio: así funciona el nuevo modo de voz

Google libera sus skills oficiales para agentes de IA: 13 habilidades compatibles con Claude Code y Copilot