| Model ID glm-5.2 | Context Window 1M | Max Context 128K | Provider Zhipu AI |
|---|---|---|---|
| Capabilities | Speed Medium | Cost Medium | Intelligence Text-to-Text |
Capacidades
- Reasoning: Cuenta con modo Thinking con capacidad de ajuste y esfuerzo controlable para tareas difíciles.
- Tools (Function Calling / MCP): Altamente confiable y enfocado en mantener el alcance.
- Structured Output (JSON): Ideal para integrarse perfectamente con los flujos operativos de herramientas externas.
Ve más en la documentación oficial: documentación glm 5.2.
Detalles (contexto, costo, retención)
Contexto Lossless Extremo
El soporte para 1 millón de tokens permite enviar un repositorio completo de código, manuales extensos e historiales pesados en un solo prompt de agente. Mantiene información continua sin perderse en “alucinaciones” a medida que avanza el chat. Cuenta con soporte para Context Caching, lo que abarata conversaciones largas en la plataforma.
Para usar el contexto máximo, necesitas activar Max Mode en el chat, pero esto puede implicar más costos.
Eficiencia de Costo
Puede superar a varios competidores (como DeepSeek v4 y Gemini 3.1 Pro en el aspecto de código sostenido) costando cerca de 1/6 del valor de alternativas propietarias equivalentes de otros proveedores.
Precio y consumo
El consumo de créditos en Tess para este modelo ocurre según los tokens procesados:- Tokens de Input (Lectura ambiental / Prompt): 0.672 créditos / 1K de tokens
- Tokens de Output (Generación de respuesta): 2.112 créditos / 1K de tokens
Las tareas con 1M de tokens pueden generar un pico alto de consumo de lectura debido al volumen absoluto de datos insertados en el input. El uso del recurso Context Caching puede ayudar en la reducción automática de este costo.