El step Extract Text from DOCX aísla y extrae el contenido textual de archivos Microsoft Word (.docx), entregando un bloque de texto limpio y listo para ser procesado por agentes de IA. Con esto, documentos complejos se convierten en datos accesibles sin necesidad de software específico ni intervención manual.Documentation Index
Fetch the complete documentation index at: https://docs.tess.im/llms.txt
Use this file to discover all available pages before exploring further.
¿Qué es?
Este step pertenece al grupo Document Processing — una categoría dedicada a transformar formatos de archivo en contenido utilizable por la IA. En la práctica, Extract Text from DOCX:- Lee la estructura interna del archivo .docx
- Extrae texto de párrafos, tablas, listas, encabezados y pies de página
- Descarta elementos visuales (imágenes, gráficos, formato)
- Entrega un bloque de texto plano en el contexto del agente
Dónde encontrarlo
- Accede al AI Studio
- Haz clic en Add AI Step
- En Select Step Category, elige Document Processing
- Selecciona Extract Text from DOCX

¿Cómo usar?
Campos de configuración:| Campo | Obligatorio | Descripción |
|---|---|---|
| Step Name | Sí | Nombre interno del step. Usa solo caracteres alfanuméricos. Se utiliza para referenciar el resultado en otros steps o prompts |
| File URL | Sí | URL pública directa del archivo .docx o una variable de entrada de archivo del usuario (ej: {{docxfile}}) |
Sobre el Output
El resultado generado es un bloque continuo de texto plano (plain text) que contiene todo el contenido extraído del documento.Qué se extrae:
- Párrafos
- Elementos de lista
- Datos de tablas (linealizados)
- Encabezados y pies de página
Qué NO se extrae:
- Imágenes y fotos
- Gráficos y elementos
- Formato visual (colores, negritas, cursivas, fuentes)
Explicación más profunda
El step funciona como una capa de decodificación de documentos.Flujo
Archivo .docx (URL o variable) → Step extrae el texto plano↓El contenido entra en el contexto → El agente lo usa para analizar, resumir o extraer datos
- La organización del documento original
- La claridad del prompt que utiliza el resultado
Ejemplos prácticos
Análisis de contratos y propuestas comerciales
Análisis de contratos y propuestas comerciales
Prompt:
“Analiza el contrato extraído. Identifica cláusulas de riesgo, resume los términos de pago y extrae los datos del cliente.”Uso:
“Analiza el contrato extraído. Identifica cláusulas de riesgo, resume los términos de pago y extrae los datos del cliente.”Uso:
- Contratos legales o propuestas comerciales en .docx
- El agente identifica puntos críticos sin lectura manual
Filtrado automático de currículums
Filtrado automático de currículums
Prompt:
“Extrae las habilidades, experiencia y formación del candidato. Compáralas con los requisitos del puesto y evalúa el encaje.”Uso:
“Extrae las habilidades, experiencia y formación del candidato. Compáralas con los requisitos del puesto y evalúa el encaje.”Uso:
- CVs enviados en .docx
- El agente clasifica y resume perfiles automáticamente
Resumen de reportes internos
Resumen de reportes internos
Prompt:
“Resume los puntos principales de este informe en hasta 5 puntos ejecutivos.”Uso:
“Resume los puntos principales de este informe en hasta 5 puntos ejecutivos.”Uso:
- Reportes mensuales, actas de reuniones o documentos de gestión
Extracción de datos estructurados
Extracción de datos estructurados
Prompt:
“Extrae del documento: nombre de la empresa, identificación fiscal, valor total, plazo de entrega y responsable técnico.”Uso:
“Extrae del documento: nombre de la empresa, identificación fiscal, valor total, plazo de entrega y responsable técnico.”Uso:
- Documentos estandarizados con campos fijos
- Alimentar CRM o hojas de cálculo automáticamente
Observaciones importantes
- El step se ejecuta antes de la interacción con el usuario
- La URL del archivo debe ser pública y accesible
- Los elementos visuales se ignoran completamente en la extracción
- El output es texto bruto, sin formato visual