Inovações recentes do AgentCore ajudam os clientes a construir, implantar e escalar agentes de IA prontos para produção
A Amazon Web Services (AWS) anunciou inovações no Amazon Bedrock AgentCore, a plataforma mais avançada para construir e implantar agentes de forma segura em escala. As Políticas no AgentCore permitem que as equipes estabeleçam limites sobre o que os agentes podem fazer com ferramentas, e o AgentCore Evaluations ajuda as equipes a entenderem como seus agentes se comportarão no mundo real. Além disso, a AWS lançou uma capacidade de memória aprimorada que permite que os agentes aprendam com a experiência e melhorem ao longo do tempo, fornecendo insights mais personalizados aos clientes.
Embora a capacidade dos agentes de raciocinar e agir de forma autônoma os torne poderosos, as organizações devem estabelecer controles robustos para prevenir acesso não autorizado a dados, interações inadequadas e erros em nível de sistema que possam impactar as operações comerciais. Mesmo com solicitações cuidadosas, os agentes cometem erros no mundo real que podem ter consequências sérias.
As Políticas no Amazon Bedrock AgentCore ajudam as organizações a estabelecer limites claros para as ações dos agentes. Usando linguagem natural, as equipes agora podem dar limites aos agentes definindo quais ferramentas e dados eles podem acessar, quais ações podem realizar e sob quais condições. Essas ferramentas podem ser APIs, funções Lambda, servidores MCP ou serviços de terceiros populares como Salesforce e Slack.
Para garantir que os agentes permaneçam rápidos e responsivos, as Políticas estão integrada ao AgentCore Gateway para verificar instantaneamente as ações dos agentes em relação às políticas em milissegundos. Isso garante que permaneçam dentro dos limites definidos enquanto operam de forma autônoma. A autoria de políticas baseada em linguagem natural fornece uma maneira mais acessível e amigável para os clientes para criar políticas detalhadas, permitindo que eles descrevam regras em linguagem natural em vez de escrever código de políticas formal.
Por exemplo, uma política simples como “Bloquear todos os reembolsos de clientes quando o valor do reembolso for superior a $1.000” pode ser implementada e aplicada de forma consistente, seguindo o princípio da Amazon de “confiar, mas verificar”. Isso permitirá que os agentes operem de forma autônoma enquanto mantêm a supervisão apropriada.
Druva é um fornecedor líder de soluções de segurança de dados. “Normalmente, os clientes podem passar horas verificando manualmente logs em dezenas de sistemas quando os backups de dados falham”, disse David Gildea, vice-presidente de Produto AI na Druva. “No entanto, com nossos agentes de IA, eles podem obter análise instantânea e remediação passo a passo para recuperação de dados. Estamos empolgados para começar com a Política no AgentCore, pois isso ajudará nossos clientes a estabelecer limites claros para o acesso dos agentes a ferramentas e dados internos, como sistemas de backup, logs de segurança e painéis de monitoramento. Com políticas apropriadas em vigor, nossos desenvolvedores podem inovar com confiança, sabendo que os agentes permanecerão dentro dos limites de conformidade definidos. Isso nos permite expandir nossa plataforma de agentes enquanto mantemos os rigorosos padrões de segurança que nossos clientes empresariais esperam.”
Visibilidade sobre o comportamento e os resultados dos agentes de IA
Diferente das métricas de software tradicionais, avaliar a qualidade dos agentes de IA requer pipelines complexos de ciência de dados, avaliações subjetivas e monitoramento contínuo em tempo real, um desafio que se agrava a cada atualização de agente ou mudança de modelo.
O AgentCore Evaluations simplifica processos complicados e elimina a gestão de infraestrutura complexa com 13 avaliadores pré-construídos para dimensões de qualidade comuns, como correção, utilidade, precisão na seleção de ferramentas, segurança, taxa de sucesso de metas e relevância contextual. Além disso, os desenvolvedores têm a flexibilidade de escrever seus próprios avaliadores personalizados usando seus LLMs e prompts preferidos. Anteriormente, isso exigia meses de trabalho em ciência de dados para construir apenas os sistemas de avaliação.
O novo serviço mostra continuamente interações ao vivo de agentes para analisar o comportamento em critérios pré-identificados, como correção, utilidade e segurança. As equipes de desenvolvimento podem configurar alertas para monitoramento proativo da qualidade, usando avaliações tanto durante os testes quanto na produção. Por exemplo, se as pontuações de satisfação de um agente de atendimento ao cliente caírem 10% em oito horas, o sistema aciona alertas imediatos, permitindo uma resposta rápida antes que a experiência do cliente seja impactada.
A Natera é líder em testes genéticos e diagnósticos. “Na Natera, estamos transformando o atendimento ao paciente oncológico por meio de agentes de IA,” disse Mirko Buholzer, líder de engenharia de software da Natera. “Nossas equipes estão atualmente realizando um esforço substancial para manter qualidade e desempenho consistentes em nossos agentes de IA, enquanto atendem a rigorosos padrões de conformidade em saúde. O AgentCore Evaluations desempenhará um papel fundamental nesse trabalho, monitorando continuamente o desempenho de nossos agentes usando métricas essenciais, como precisão, utilidade e satisfação do paciente. Esperamos que essa inteligência de qualidade em tempo real nos ajude a identificar e abordar rapidamente problemas de forma preventiva. Com o AgentCore Evaluations, nosso objetivo é implantar agentes confiáveis que mantenham nossos altos padrões e apoiem a entrega de atendimento ao paciente em escala.”
Agentes mais inteligentes a cada interação
A maioria dos agentes de IA hoje carece de capacidades críticas de memória porque ela muitas vezes é limitada a uma janela de contexto de curto prazo redefinida a cada nova interação, impedindo-os de aprender com sucessos ou falhas passadas em ambientes de produção.
AgentCore Memory fornece esse recurso crítico, permitindo que um agente construa uma compreensão coerente dos usuários ao longo do tempo. Hoje, AgentCore Memory está se tornando uma nova funcionalidade episódica disponível que permite que os agentes aprendam com experiências passadas e apliquem esses insights a interações futuras.
Através de episódios estruturados que capturam contexto, raciocínio, ações e resultados, outro agente analisa automaticamente padrões para melhorar a tomada de decisões. Quando os agentes encontram tarefas semelhantes, eles podem acessar rapidamente dados históricos relevantes, reduzindo o tempo de processamento e eliminando a necessidade de instruções personalizadas extensas.
Por exemplo, um agente reserva transporte para o aeroporto 45 minutos antes do voo quando você está viajando sozinho. Três meses depois, quando você está viajando para o mesmo destino — com crianças desta vez — ele agenda automaticamente a coleta duas horas antes, lembrando os desafios da viagem em família. Essa abordagem de aprendizado direcionado ajuda os agentes a tomar decisões mais consistentes com base em dados de desempenho reais, em vez de depender de diretrizes pré-determinadas.
A S&P Global Market Intelligence fornece insights e soluções de dados e tecnologia líderes para investidores institucionais, bancos e corporações. “Recentemente, desenvolvemos a Astra, uma plataforma interna de fluxo de trabalho agente geral, mas enfrentamos desafios na orquestração de fluxos de trabalho complexos de múltiplos agentes em nossa organização distribuída,” disse Astier Helen, chefe de Tecnologia, MI Enterprise Technology e Sustentabilidade na S&P Global Market Intelligence. “À medida que centenas de agentes especializados surgiram, gerenciar o estado e manter um contexto consistente se tornou cada vez mais difícil, destacando a necessidade de uma camada de memória unificada. O Amazon Bedrock AgentCore Memory forneceu a solução. Com a nova funcionalidade de memória episódica, nossos agentes aprenderão com análises anteriores para gerar insights mais inteligentes. Anteriormente, implantar agentes na plataforma Astra levava semanas. Agora, podemos criar e implantar um agente ou servidor MCP em minutos.”
Para mais detalhes sobre as novas inovações do Amazon Bedrock AgentCore, visite o blog.