| Model ID glm-5.2 | Context Window 1M | Max Context 128K | Provider Zhipu AI |
|---|---|---|---|
| Capabilities | Speed Medium | Cost Medium | Intelligence Text-to-Text |
Capacidades
- Reasoning: Possui modo Thinking com capacidade de ajuste e esforço controlável para tarefas difíceis.
- Tools (Function Calling / MCP): Altamente confiável e focado em manter o escopo.
- Structured Output (JSON): Ideal para integrar perfeitamente com os fluxos operacionais de ferramentas externas.
Veja mais na documentação oficial: documentação glm 5.2.
Detalhamentos (contexto, custo, retenção)
Contexto Lossless Extremo
O suporte a 1 milhão de tokens possibilita enviar um repositório inteiro de código, manuais extensos e históricos pesados em um só prompt de agente. Ele mantém informações contínuas sem se perder em “alucinações” conforme o chat avança. Possui suporte a Context Caching, que barateia conversas longas na plataforma.
Para usar o contexto máximo é preciso ativar o Max Mode no chat, mas isso pode implicar em mais custos.
Eficiência de Custo
Ele consegue superar diversos concorrentes (como DeepSeek v4 e Gemini 3.1 Pro no aspecto de código sustentado) custando cerca de 1/6 do valor de alternativas proprietárias equivalentes de outros provedores.
Preço e consumo
O consumo de créditos na Tess para este modelo ocorre conforme os tokens processados:- Tokens de Input (Leitura ambiental / Prompt): 0.672 créditos / 1K de tokens
- Tokens de Output (Geração de resposta): 2.112 créditos / 1K de tokens
Tarefas com 1M de tokens podem gerar alto pico de consumo de leitura devido ao volume absoluto de dados inseridos no input. O uso do recurso Context Caching pode auxiliar na redução automática desse custo.