¿Qué es?
Este step pertenece al grupo Document Processing — una categoría dedicada a transformar formatos de archivo en contenido utilizable por la IA. En la práctica, Extract Text from DOCX:- Lee la estructura interna del archivo .docx
- Extrae texto de párrafos, tablas, listas, encabezados y pies de página
- Descarta elementos visuales (imágenes, gráficos, formato)
- Entrega un bloque de texto plano en el contexto del agente
Dónde encontrarlo
- Accede al AI Studio
- Haz clic en Add AI Step
- En Select Step Category, elige Document Processing
- Selecciona Extract Text from DOCX

¿Cómo usar?
Campos de configuración:| Campo | Obligatorio | Descripción |
|---|---|---|
| Step Name | Sí | Nombre interno del step. Usa solo caracteres alfanuméricos. Se utiliza para referenciar el resultado en otros steps o prompts |
| File URL | Sí | URL pública directa del archivo .docx o una variable de entrada de archivo del usuario (ej: {{docxfile}}) |
Sobre el Output
El resultado generado es un bloque continuo de texto plano (plain text) que contiene todo el contenido extraído del documento.Qué se extrae:
- Párrafos
- Elementos de lista
- Datos de tablas (linealizados)
- Encabezados y pies de página
Qué NO se extrae:
- Imágenes y fotos
- Gráficos y elementos
- Formato visual (colores, negritas, cursivas, fuentes)
Explicación más profunda
El step funciona como una capa de decodificación de documentos.Flujo
Archivo .docx (URL o variable) → Step extrae el texto plano↓El contenido entra en el contexto → El agente lo usa para analizar, resumir o extraer datos
- La organización del documento original
- La claridad del prompt que utiliza el resultado
Ejemplos prácticos
Análisis de contratos y propuestas comerciales
Análisis de contratos y propuestas comerciales
Prompt:
“Analiza el contrato extraído. Identifica cláusulas de riesgo, resume los términos de pago y extrae los datos del cliente.”Uso:
“Analiza el contrato extraído. Identifica cláusulas de riesgo, resume los términos de pago y extrae los datos del cliente.”Uso:
- Contratos legales o propuestas comerciales en .docx
- El agente identifica puntos críticos sin lectura manual
Filtrado automático de currículums
Filtrado automático de currículums
Prompt:
“Extrae las habilidades, experiencia y formación del candidato. Compáralas con los requisitos del puesto y evalúa el encaje.”Uso:
“Extrae las habilidades, experiencia y formación del candidato. Compáralas con los requisitos del puesto y evalúa el encaje.”Uso:
- CVs enviados en .docx
- El agente clasifica y resume perfiles automáticamente
Resumen de reportes internos
Resumen de reportes internos
Prompt:
“Resume los puntos principales de este informe en hasta 5 puntos ejecutivos.”Uso:
“Resume los puntos principales de este informe en hasta 5 puntos ejecutivos.”Uso:
- Reportes mensuales, actas de reuniones o documentos de gestión
Extracción de datos estructurados
Extracción de datos estructurados
Prompt:
“Extrae del documento: nombre de la empresa, identificación fiscal, valor total, plazo de entrega y responsable técnico.”Uso:
“Extrae del documento: nombre de la empresa, identificación fiscal, valor total, plazo de entrega y responsable técnico.”Uso:
- Documentos estandarizados con campos fijos
- Alimentar CRM o hojas de cálculo automáticamente
Observaciones importantes
- El step se ejecuta antes de la interacción con el usuario
- La URL del archivo debe ser pública y accesible
- Los elementos visuales se ignoran completamente en la extracción
- El output es texto bruto, sin formato visual