GLM 5.2 - Tess AI Docs

O GLM-5.2 é o modelo de linguagem open-source (código aberto) de alto desempenho desenvolvido pela Zhipu AI, projetado especificamente para tarefas de longo horizonte (long-horizon tasks). Com uma janela de contexto massiva de 1 milhão de tokens sem perda de precisão (lossless), ele é a escolha ideal para leitura de bases de código completas, refatorações complexas interligadas e desenvolvimento avançado de workflows de engenharia estruturados por agentes na Tess.

Model ID glm-5.2	Context Window 1M	Max Context 128K	Provider Zhipu AI
Capabilities	Speed Medium	Cost Medium	Intelligence Text-to-Text

Capacidades

Reasoning: Possui modo Thinking com capacidade de ajuste e esforço controlável para tarefas difíceis.
Tools (Function Calling / MCP): Altamente confiável e focado em manter o escopo.
Structured Output (JSON): Ideal para integrar perfeitamente com os fluxos operacionais de ferramentas externas.

Veja mais na documentação oficial: documentação glm 5.2.

Detalhamentos (contexto, custo, retenção)

Contexto Lossless Extremo

O suporte a 1 milhão de tokens possibilita enviar um repositório inteiro de código, manuais extensos e históricos pesados em um só prompt de agente. Ele mantém informações contínuas sem se perder em “alucinações” conforme o chat avança. Possui suporte a Context Caching, que barateia conversas longas na plataforma.

Para usar o contexto máximo é preciso ativar o Max Mode no chat, mas isso pode implicar em mais custos.

Eficiência de Custo

Ele consegue superar diversos concorrentes (como DeepSeek v4 e Gemini 3.1 Pro no aspecto de código sustentado) custando cerca de 1/6 do valor de alternativas proprietárias equivalentes de outros provedores.

Preço e consumo

O consumo de créditos na Tess para este modelo ocorre conforme os tokens processados:

Tokens de Input (Leitura ambiental / Prompt): 0.672 créditos / 1K de tokens
Tokens de Output (Geração de resposta): 2.112 créditos / 1K de tokens

Tarefas com 1M de tokens podem gerar alto pico de consumo de leitura devido ao volume absoluto de dados inseridos no input. O uso do recurso Context Caching pode auxiliar na redução automática desse custo.

Boas práticas

Defina limites de segurança na codificação: Por seguir estritamente padrões arquitetônicos de produção, dê instruções restritivas claras no prompt, como: “Adote os padrões de lint, use a convenção de commit X, e teste isoladamente a regra Y”. O GLM-5.2 retém esse comando muito melhor do que modelos convencionais.
Aumente o raciocínio em interações com Bugs: Para problemas como análise de logs de servidor, deixe instruído em seu prompt e nos Agentes para utilizarem raciocínio passo a passo antes de imprimir a solução final.
Desvie casos multimodais: Como ele não tem habilidades de imagem (Vision), se a sua automação precisar ler telas e fazer testes via prints da interface visual, roteie essa etapa primeiro para os modelos GLM-5V-Turbo ou GLM-OCR.

O modelo GLM-5.2 da Zhipu AI quebra a barreira entre o código aberto e a execução corporativa de altíssimo nível. Com sua capacidade de absorver muitas informações aliada ao raciocínio lógico focado em manter o prumo para tarefas longas, ele é a ferramenta ideal dentro da Tess para engenheiros, pesquisadores avançados e criadores de automações que não podem arriscar falhas técnicas em grandes volumes de transição de dados.

Claude Fable 5 (Anthropic)

⌘I

​Capacidades

​Detalhamentos (contexto, custo, retenção)

Contexto Lossless Extremo

Eficiência de Custo

​Preço e consumo

Capacidades

Detalhamentos (contexto, custo, retenção)

Preço e consumo