Saltar al contenido principal
El step Marker Document Processing convierte archivos complejos (PDF, DOCX, PPTX, imágenes, etc.) en Markdown estructurado, preservando la organización del contenido. Es ideal para transformar materiales ricos en datos limpios y utilizables por agentes de IA.

¿Qué es el Step?

Este step actúa como un conversor universal de documentos, traduciendo diferentes formatos a texto estructurado. En la práctica:
  • Lee archivos como PDF, Word, presentaciones e imágenes
  • Interpreta la estructura (títulos, listas, tablas, etc.)
  • Convierte todo a Markdown
  • Entrega contenido organizado y listo para uso en IA
A diferencia de otros steps:
  • No genera solo texto bruto
  • Preserva la estructura lógica del documento

Dónde encontrarlo

  1. Accede al AI Studio
  2. Haz clic en Add AI Step
  3. Selecciona Document Processing
  4. Elige Marker Document Processing
Image

¿Cómo usar?

Campos de configuración

CampoObligatorioDescripción
Step NameNombre interno del step (alfanumérico). Se usa como referencia en el agente
File URLURL directa del archivo (debe terminar en: .pdf, .docx, .jpg, etc.)
Processing ModeDefine calidad vs velocidad: Fast, Balanced, Accurate
Use LLMNoYes/No. Mejora la precisión (tablas, layout, formularios), pero aumenta el tiempo de procesamiento
Max PagesNoNúmero máximo de páginas a procesar
Page RangeNoRango de páginas (ej: 0,2-4)
Reglas importantes de configuración
  • Max Pages y Page Range son mutuamente excluyentes
  • File URL debe ser directo (no puede ser una página de vista previa)
  • Use LLM aumenta el costo y el tiempo de procesamiento

Explicación más profunda

Este step funciona como un traductor de documentos a lenguaje estructurado (Markdown).

Flujo

Documento (PDF, DOCX, imagen…) → Step interpreta la estructuraConvierte a Markdown → El agente recibe contenido organizado

Markdown vs texto plano

Comparación práctica:
  • Extract Text (DOCX, TXT, etc.) → texto lineal bruto
  • Marker Document Processing → texto estructurado (con jerarquía)
Ejemplo: # Título ## Subtítulo - Item 1 - Item 2 | Columna A | Columna B | |----------|----------|

Ejemplos prácticos

  • PDFs, presentaciones y e-books
  • Convertir todo a Markdown
  • Usar como base para generación de contenido
  • Procesar contratos o propuestas
  • Activar Use LLM para mejor lectura de tablas
  • Extraer:
    • valores
    • plazos
    • cláusulas
  • PDFs, imágenes, DOCX
  • Estandarizar todo en Markdown
  • El agente compara con la vacante automáticamente
  • Documentos internos → Markdown
  • Alimentar agentes de soporte o FAQ
Prompt:
“Extrae todas las tablas y organiza los datos en formato estructurado.”
Buenas prácticas
  • Usa “Balanced” como estándar: mejor relación costo-beneficio, pero evalúa según tu caso
  • Usa LLMs más robustos para documentos complejos, especialmente: tablas, formularios y layouts rotos
  • Usa Page Range en documentos grandes: evita consumo innecesario
  • Asegura URLs directas: ej: .pdf, .docx (no vista previa de Google Drive)
  • Combina con otros steps: Marker → análisis → guardar en Drive/Sheets

Observaciones importantes

  • Links con login o vista previa no funcionan
  • Use LLM aumenta tiempo y costo
  • Archivos grandes afectan el rendimiento
  • La estructura se preserva, pero no es perfecta en todos los casos
Marker Document Processing es el step más potente para manejar documentos complejos. Al convertir múltiples formatos en Markdown estructurado, permite que los agentes de IA trabajen con datos organizados, preservando contexto y jerarquía — clave para análisis más precisos y automatizaciones robustas.