O step Extract Text from DOCX isola e extrai o conteúdo textual de arquivos Microsoft Word (.docx), entregando um bloco de texto limpo e pronto para ser processado por agentes de IA. Com ele, documentos complexos se tornam dados acessíveis sem necessidade de softwares específicos ou intervenção manual.Documentation Index
Fetch the complete documentation index at: https://docs.tess.im/llms.txt
Use this file to discover all available pages before exploring further.
O que é
Este step pertence ao grupo Document Processing — categoria dedicada a transformar formatos de arquivo em conteúdo utilizável pela IA. Na prática, o Extract Text from DOCX:- Lê a estrutura interna do arquivo .docx
- Extrai texto de parágrafos, tabelas, listas, cabeçalhos e rodapés
- Descarta elementos visuais (imagens, gráficos, formatação)
- Entrega um bloco de texto puro no contexto do agente
Onde encontrar
- Acesse o AI Studio
- Clique em Add AI Step
- Em Select Step Category, escolha Document Processing
- Selecione Extract Text from DOCX

Como usar?
Campos de configuração:| Campo | Obrigatório | Descrição |
|---|---|---|
| Step Name | Sim | Nome interno do step. Use apenas caracteres alfanuméricos. Utilizado para referenciar o resultado em outros steps ou prompts |
| File URL | Sim | URL pública direta do arquivo .docx ou variável de entrada de arquivo do usuário (ex: {{docxfile}}) |
Sobre o Output
O resultado gerado é um bloco contínuo de texto simples (plain text) contendo todo o conteúdo extraído do documento.O que é extraído:
- Parágrafos
- Itens de lista
- Dados de tabelas (linearizados)
- Cabeçalhos e rodapés
O que NÃO é extraído:
- Imagens e fotos
- Gráficos e elementos
- Formatação visual do documento (cores, negrito, itálico, fontes)
Explicação mais profunda
O step funciona como uma camada de decodificação de documentos.Fluxo
Arquivo .docx (URL ou variável) → Step extrai o texto puro↓Conteúdo entra no contexto → Agente usa para analisar, resumir ou extrair dados
- Organização do documento original
- Clareza do prompt que usa o resultado
Exemplos práticos
Análise de contratos e propostas comerciais
Análise de contratos e propostas comerciais
Prompt:
“Analise o contrato extraído. Identifique cláusulas de risco, resumo dos termos de pagamento e dados do cliente.”Uso:
“Analise o contrato extraído. Identifique cláusulas de risco, resumo dos termos de pagamento e dados do cliente.”Uso:
- Contratos jurídicos ou propostas comerciais em .docx
- Agente identifica pontos críticos sem leitura manual
Triagem automática de currículos
Triagem automática de currículos
Prompt:
“Extraia as habilidades, experiências e formação do candidato. Compare com os requisitos da vaga abaixo e avalie o fit.”Uso:
“Extraia as habilidades, experiências e formação do candidato. Compare com os requisitos da vaga abaixo e avalie o fit.”Uso:
- CVs enviados em .docx
- Agente classifica e resume perfis automaticamente
Resumo de relatórios internos
Resumo de relatórios internos
Prompt:
“Resuma os principais pontos deste relatório em até 5 tópicos executivos.”Uso:
“Resuma os principais pontos deste relatório em até 5 tópicos executivos.”Uso:
- Relatórios mensais, atas de reunião ou documentos de gestão
Extração de dados estruturados
Extração de dados estruturados
Prompt:
“Extraia do documento: nome da empresa, CNPJ, valor total, prazo de entrega e responsável técnico.”Uso:
“Extraia do documento: nome da empresa, CNPJ, valor total, prazo de entrega e responsável técnico.”Uso:
- Documentos padronizados com campos fixos
- Alimentar CRM ou planilhas automaticamente
Observações importantes
- O step roda antes da interação com o usuário
- A URL do arquivo precisa ser pública e acessível
- Elementos visuais são completamente ignorados na extração
- O output é texto bruto, sem formatação visual