O que é
Este step pertence ao grupo Document Processing — categoria dedicada a transformar formatos de arquivo em conteúdo utilizável pela IA. Na prática, o Extract Text from DOCX:- Lê a estrutura interna do arquivo .docx
- Extrai texto de parágrafos, tabelas, listas, cabeçalhos e rodapés
- Descarta elementos visuais (imagens, gráficos, formatação)
- Entrega um bloco de texto puro no contexto do agente
Onde encontrar
- Acesse o AI Studio
- Clique em Add AI Step
- Em Select Step Category, escolha Document Processing
- Selecione Extract Text from DOCX

Como usar?
Campos de configuração:| Campo | Obrigatório | Descrição |
|---|---|---|
| Step Name | Sim | Nome interno do step. Use apenas caracteres alfanuméricos. Utilizado para referenciar o resultado em outros steps ou prompts |
| File URL | Sim | URL pública direta do arquivo .docx ou variável de entrada de arquivo do usuário (ex: {{docxfile}}) |
Sobre o Output
O resultado gerado é um bloco contínuo de texto simples (plain text) contendo todo o conteúdo extraído do documento.O que é extraído:
- Parágrafos
- Itens de lista
- Dados de tabelas (linearizados)
- Cabeçalhos e rodapés
O que NÃO é extraído:
- Imagens e fotos
- Gráficos e elementos
- Formatação visual do documento (cores, negrito, itálico, fontes)
Explicação mais profunda
O step funciona como uma camada de decodificação de documentos.Fluxo
Arquivo .docx (URL ou variável) → Step extrai o texto puro↓Conteúdo entra no contexto → Agente usa para analisar, resumir ou extrair dados
- Organização do documento original
- Clareza do prompt que usa o resultado
Exemplos práticos
Análise de contratos e propostas comerciais
Análise de contratos e propostas comerciais
Prompt:
“Analise o contrato extraído. Identifique cláusulas de risco, resumo dos termos de pagamento e dados do cliente.”Uso:
“Analise o contrato extraído. Identifique cláusulas de risco, resumo dos termos de pagamento e dados do cliente.”Uso:
- Contratos jurídicos ou propostas comerciais em .docx
- Agente identifica pontos críticos sem leitura manual
Triagem automática de currículos
Triagem automática de currículos
Prompt:
“Extraia as habilidades, experiências e formação do candidato. Compare com os requisitos da vaga abaixo e avalie o fit.”Uso:
“Extraia as habilidades, experiências e formação do candidato. Compare com os requisitos da vaga abaixo e avalie o fit.”Uso:
- CVs enviados em .docx
- Agente classifica e resume perfis automaticamente
Resumo de relatórios internos
Resumo de relatórios internos
Prompt:
“Resuma os principais pontos deste relatório em até 5 tópicos executivos.”Uso:
“Resuma os principais pontos deste relatório em até 5 tópicos executivos.”Uso:
- Relatórios mensais, atas de reunião ou documentos de gestão
Extração de dados estruturados
Extração de dados estruturados
Prompt:
“Extraia do documento: nome da empresa, CNPJ, valor total, prazo de entrega e responsável técnico.”Uso:
“Extraia do documento: nome da empresa, CNPJ, valor total, prazo de entrega e responsável técnico.”Uso:
- Documentos padronizados com campos fixos
- Alimentar CRM ou planilhas automaticamente
Observações importantes
- O step roda antes da interação com o usuário
- A URL do arquivo precisa ser pública e acessível
- Elementos visuais são completamente ignorados na extração
- O output é texto bruto, sem formatação visual