Quando apenas Prompt não é suficiente no agente?
Imagine que você quer criar um agente e automatizar a geração de uma descrição de um produto. Todas as informações sobre esse produto estão em um catálogo em PDF. Se você apenas der o arquivo PDF ao agente na entrada do usuário, ele não saberá o que fazer. A IA precisa de uma instrução para, primeiro, ler e interpretar o conteúdo daquele arquivo. Uma etapa prévia e obrigatória na estrutura do agente como um todo. É exatamente para isso que servem os Steps Avançados: eles dão ao seu agente a capacidade de executar ações preliminares para complementar o contexto necessário do seu treinamento.Exemplos de Steps Avançados Disponíveis
Você pode equipar seu agente com uma variedade de “sentidos” e habilidades, incluindo:Extração de texto de PDF
Extração de texto de PDF
Permite que o agente leia e extraia todo o texto de um documento PDF.
Leitura de imagens com OCR
Leitura de imagens com OCR
Uma habilidade poderosa para extrair texto que está dentro de imagens (como em um panfleto digitalizado ou um print de tela).
Leitura de páginas selecionadas de um PDF
Leitura de páginas selecionadas de um PDF
Otimiza o processo, permitindo que você instrua o agente a focar apenas nas páginas relevantes de um documento longo.
Web Scraping
Web Scraping
Transforma seu agente em um “leitor de internet”, capaz de extrair informações de páginas da web, como o conteúdo de um artigo ou dados de um e-commerce.
Pesquisa no Google
Pesquisa no Google
Permite que o agente faça uma pesquisa no Google e utilize os resultados como base para a sua resposta.
Como Funciona na Prática: A Sequência de Ações
Quando você configura um Step Avançado, você está definindo uma linha de montagem para o seu agente:Entrada do Usuário (Opcional)
Quando necessário, o usuário fornece o material inicial (ex: arquivo PDF, uma URL de um site).
Execução do Step Avançado
O agente executa a ação que você configurou (ex: extrai o texto do PDF, faz o web scraping da URL).
Contextualização para a IA
O resultado do step (o texto extraído, o conteúdo do site, nesse caso específico) é automaticamente fornecido como informação de contexto para o prompt da IA no espaço da variável.
Geração da Resposta Final
A IA, agora com as informações recebidas, executa o seu prompt principal (ex: “Crie uma descrição de produto com base no texto extraído”) e entrega o resultado.
Pontos de Atenção para o Uso Eficaz
Impacto no Tempo de Processamento
Lembre-se que cada Step é uma tarefa adicional no fluxo de trabalho do seu agente. Isso pode aumentar um pouco o tempo de processamento para iniciar a conversa (agente de chat), ou para entregar o resultado final (agente de texto). Portanto, use-os de forma estratégica, apenas quando forem realmente necessários.
Eles não rodam ao longo de um chat
Como o principal objetivo de um step é complementar o treino com tarefas e recursos avançados, ele rodará no início de um chat ou processamento do agente de texto, de forma preliminar.
Exemplo: Sabemos que há um agente que cria eventos na agenda do Google Calendar. Esse step não é acionado ao longo de uma conversa no chat, por exemplo, ele roda no início, logo depois de o usuário completar os inputs necessários. Então, se eu precisasse criar um agente que criasse eventos na minha agenda eu precisaria:Ou seja, antes de conversar com o chat, isso tudo precisaria acontecer.
- Incluir um step para pegar as informações da agenda (App Integration)
- Rodar um assistente de IA que visse os slots disponíveis e estabelecesse o novo horário
- Coletar via entradas as informações requeridas para criar um evento
- Usar o step de criação de evento
A Conexão Crucial com o Prompt
Não basta apenas adicionar um Step Avançado; você precisa instruir a IA no seu prompt sobre como usar a informação que ele fornece. Em outras palavras: trazer o parâmetro criado para o Step para o seu prompt e encaixá-lo no local adequado da estrutura do prompt.Exemplo: Se você adicionou um step de “Extração de texto de PDF”, seu prompt principal deve conter algo como:“Com base no texto extraído do documento, identifique os principais benefícios do produto e escreva três parágrafos sobre eles: texto-do-pdf”Essa instrução conecta a ação do step com o raciocínio do LLM, garantindo que a informação coletada seja usada de forma eficaz.

