Pular para o conteúdo principal
Ao construir um agente no AI Studio da Tess AI, você pode ir muito além de um simples treinamento. Com os Steps Avançados, você pode criar agentes que executam tarefas prévias, processam informações de múltiplas fontes antes de iniciar a conversa (agente de chat) ou entregar o resultado final (agente de texto). Os AI Steps funcionam como etapas de execução obrigatória a cada vez que o agente é acionado. Apesar de opcionais, os AI Steps podem, quando necessário, sofisticar a arquitetura do seu agente e aumentar o seu poder de funcionamento. Mas tenha em mente que nem sempre os AI Steps serão necessários.

Quando apenas Prompt não é suficiente no agente?

Imagine que você quer criar um agente e automatizar a geração de uma descrição de um produto. Todas as informações sobre esse produto estão em um catálogo em PDF. Se você apenas der o arquivo PDF ao agente na entrada do usuário, ele não saberá o que fazer. A IA precisa de uma instrução para, primeiro, ler e interpretar o conteúdo daquele arquivo. Uma etapa prévia e obrigatória na estrutura do agente como um todo. É exatamente para isso que servem os Steps Avançados: eles dão ao seu agente a capacidade de executar ações preliminares para complementar o contexto necessário do seu treinamento.

Exemplos de Steps Avançados Disponíveis

Você pode equipar seu agente com uma variedade de “sentidos” e habilidades, incluindo:
Permite que o agente leia e extraia todo o texto de um documento PDF.
Uma habilidade poderosa para extrair texto que está dentro de imagens (como em um panfleto digitalizado ou um print de tela).
Otimiza o processo, permitindo que você instrua o agente a focar apenas nas páginas relevantes de um documento longo.
Transforma seu agente em um “leitor de internet”, capaz de extrair informações de páginas da web, como o conteúdo de um artigo ou dados de um e-commerce.
Permite que o agente faça uma pesquisa no Google e utilize os resultados como base para a sua resposta.

Como Funciona na Prática: A Sequência de Ações

Quando você configura um Step Avançado, você está definindo uma linha de montagem para o seu agente:

Entrada do Usuário (Opcional)

Quando necessário, o usuário fornece o material inicial (ex: arquivo PDF, uma URL de um site).

Execução do Step Avançado

O agente executa a ação que você configurou (ex: extrai o texto do PDF, faz o web scraping da URL).

Contextualização para a IA

O resultado do step (o texto extraído, o conteúdo do site, nesse caso específico) é automaticamente fornecido como informação de contexto para o prompt da IA no espaço da variável.

Geração da Resposta Final

A IA, agora com as informações recebidas, executa o seu prompt principal (ex: “Crie uma descrição de produto com base no texto extraído”) e entrega o resultado.

Pontos de Atenção para o Uso Eficaz

Impacto no Tempo de Processamento

Lembre-se que cada Step é uma tarefa adicional no fluxo de trabalho do seu agente. Isso pode aumentar um pouco o tempo de processamento para iniciar a conversa (agente de chat), ou para entregar o resultado final (agente de texto). Portanto, use-os de forma estratégica, apenas quando forem realmente necessários.

Eles não rodam ao longo de um chat

Como o principal objetivo de um step é complementar o treino com tarefas e recursos avançados, ele rodará no início de um chat ou processamento do agente de texto, de forma preliminar. 
Exemplo: Sabemos que há um agente que cria eventos na agenda do Google Calendar. Esse step não é acionado ao longo de uma conversa no chat, por exemplo, ele roda no início, logo depois de o usuário completar os inputs necessários.  Então, se eu precisasse criar um agente que criasse eventos na minha agenda eu precisaria:
  • Incluir um step para pegar as informações da agenda (App Integration)
  • Rodar um assistente de IA que visse os slots disponíveis e estabelecesse o novo horário
  • Coletar via entradas as informações requeridas para criar um evento
  • Usar o step de criação de evento
Ou seja, antes de conversar com o chat, isso tudo precisaria acontecer.

A Conexão Crucial com o Prompt

Não basta apenas adicionar um Step Avançado; você precisa instruir a IA no seu prompt sobre como usar a informação que ele fornece. Em outras palavras: trazer o parâmetro criado para o Step para o seu prompt e encaixá-lo no local adequado da estrutura do prompt.Exemplo: Se você adicionou um step de “Extração de texto de PDF”, seu prompt principal deve conter algo como:“Com base no texto extraído do documento, identifique os principais benefícios do produto e escreva três parágrafos sobre eles: texto-do-pdfEssa instrução conecta a ação do step com o raciocínio do LLM, garantindo que a informação coletada seja usada de forma eficaz.