Funcionamento: AI Steps

Ao construir um agente no AI Studio da Tess AI, você pode ir muito além de um simples treinamento. Com os Steps Avançados, você pode criar agentes que executam tarefas prévias, processam informações de múltiplas fontes antes de iniciar a conversa (agente de chat) ou entregar o resultado final (agente de texto). Os AI Steps funcionam como etapas de execução obrigatória a cada vez que o agente é acionado. Apesar de opcionais, os AI Steps podem, quando necessário, sofisticar a arquitetura do seu agente e aumentar o seu poder de funcionamento. Mas tenha em mente que nem sempre os AI Steps serão necessários.

Quando apenas Prompt não é suficiente no agente?

Imagine que você quer criar um agente e automatizar a geração de uma descrição de um produto. Todas as informações sobre esse produto estão em um catálogo em PDF. Se você apenas der o arquivo PDF ao agente na entrada do usuário, ele não saberá o que fazer. A IA precisa de uma instrução para, primeiro, ler e interpretar o conteúdo daquele arquivo. Uma etapa prévia e obrigatória na estrutura do agente como um todo. É exatamente para isso que servem os Steps Avançados: eles dão ao seu agente a capacidade de executar ações preliminares para complementar o contexto necessário do seu treinamento.

Exemplos de Steps Avançados Disponíveis

Você pode equipar seu agente com uma variedade de “sentidos” e habilidades, incluindo:

Extração de texto de PDF

Permite que o agente leia e extraia todo o texto de um documento PDF.

Leitura de imagens com OCR

Uma habilidade poderosa para extrair texto que está dentro de imagens (como em um panfleto digitalizado ou um print de tela).

Leitura de páginas selecionadas de um PDF

Otimiza o processo, permitindo que você instrua o agente a focar apenas nas páginas relevantes de um documento longo.

Web Scraping

Transforma seu agente em um “leitor de internet”, capaz de extrair informações de páginas da web, como o conteúdo de um artigo ou dados de um e-commerce.

Pesquisa no Google

Permite que o agente faça uma pesquisa no Google e utilize os resultados como base para a sua resposta.

Como Funciona na Prática: A Sequência de Ações

Quando você configura um Step Avançado, você está definindo uma linha de montagem para o seu agente:

Entrada do Usuário (Opcional)

Quando necessário, o usuário fornece o material inicial (ex: arquivo PDF, uma URL de um site).

Execução do Step Avançado

O agente executa a ação que você configurou (ex: extrai o texto do PDF, faz o web scraping da URL).

Contextualização para a IA

O resultado do step (o texto extraído, o conteúdo do site, nesse caso específico) é automaticamente fornecido como informação de contexto para o prompt da IA no espaço da variável.

Geração da Resposta Final

A IA, agora com as informações recebidas, executa o seu prompt principal (ex: “Crie uma descrição de produto com base no texto extraído”) e entrega o resultado.

Pontos de Atenção para o Uso Eficaz

Impacto no Tempo de Processamento

Lembre-se que cada Step é uma tarefa adicional no fluxo de trabalho do seu agente. Isso pode aumentar um pouco o tempo de processamento para iniciar a conversa (agente de chat), ou para entregar o resultado final (agente de texto). Portanto, use-os de forma estratégica, apenas quando forem realmente necessários.

Eles não rodam ao longo de um chat

Como o principal objetivo de um step é complementar o treino com tarefas e recursos avançados, ele rodará no início de um chat ou processamento do agente de texto, de forma preliminar.

Exemplo: Sabemos que há um agente que cria eventos na agenda do Google Calendar. Esse step não é acionado ao longo de uma conversa no chat, por exemplo, ele roda no início, logo depois de o usuário completar os inputs necessários. Então, se eu precisasse criar um agente que criasse eventos na minha agenda eu precisaria:

Incluir um step para pegar as informações da agenda (App Integration)

Rodar um assistente de IA que visse os slots disponíveis e estabelecesse o novo horário

Coletar via entradas as informações requeridas para criar um evento

Usar o step de criação de evento

Ou seja, antes de conversar com o chat, isso tudo precisaria acontecer.

A Conexão Crucial com o Prompt

Não basta apenas adicionar um Step Avançado; você precisa instruir a IA no seu prompt sobre como usar a informação que ele fornece. Em outras palavras: trazer o parâmetro criado para o Step para o seu prompt e encaixá-lo no local adequado da estrutura do prompt.Exemplo: Se você adicionou um step de “Extração de texto de PDF”, seu prompt principal deve conter algo como:“Com base no texto extraído do documento, identifique os principais benefícios do produto e escreva três parágrafos sobre eles: texto-do-pdf”Essa instrução conecta a ação do step com o raciocínio do LLM, garantindo que a informação coletada seja usada de forma eficaz.

Agentes

Geradores

Entradas do Usuário

AI Steps

Funcionamento: AI Steps

Quando apenas Prompt não é suficiente no agente?

Exemplos de Steps Avançados Disponíveis

Como Funciona na Prática: A Sequência de Ações

Entrada do Usuário (Opcional)

Execução do Step Avançado

Contextualização para a IA

Geração da Resposta Final

Pontos de Atenção para o Uso Eficaz

Impacto no Tempo de Processamento

Eles não rodam ao longo de um chat

A Conexão Crucial com o Prompt

Agentes

Geradores

Entradas do Usuário

AI Steps

​Quando apenas Prompt não é suficiente no agente?

​Exemplos de Steps Avançados Disponíveis

​Como Funciona na Prática: A Sequência de Ações

Entrada do Usuário (Opcional)

Execução do Step Avançado

Contextualização para a IA

Geração da Resposta Final

​Pontos de Atenção para o Uso Eficaz

Impacto no Tempo de Processamento

Eles não rodam ao longo de um chat

A Conexão Crucial com o Prompt

Quando apenas Prompt não é suficiente no agente?

Exemplos de Steps Avançados Disponíveis

Como Funciona na Prática: A Sequência de Ações

Pontos de Atenção para o Uso Eficaz