Dia 1 do StartSe AI Festival 2026: minhas notas para engenheiros de software

Estou em São Paulo essa semana, para o StartSe AI Festival 2026 (13 e 14 de maio, no Pro Magno Centro de Eventos). Para contextualizar quem está lendo de fora do Brasil: esse é o maior evento de IA do país hoje. Cerca de 4.000 pessoas na sala, e uma curadoria que trouxe Anthropic, Google DeepMind, Microsoft, Genspark, ElevenLabs, McKinsey e IBM para o mesmo palco em que sobem operadores brasileiros como o iFood. Se você constrói software para viver e quer sentir para onde a indústria está indo, é essa a sala.

Vou passar por cada palestra em um parágrafo, com os bullets que estou guardando. Os posts mais aprofundados sobre as palestras que achei mais relevantes saem nos próximos dias.

Cristiano Kruel, Chief Innovation Officer da StartSe, abriu o festival com uma proposta: para ler para onde a economia da IA está indo, separa em cinco camadas e olha cada uma. Ele percorreu os números por trás disso (algo como US$ 645 bilhões em 2026 só entre Microsoft, Meta, Amazon, Google e Oracle) e traçou um paralelo com os primeiros anos da internet comercial para defender que ainda estamos muito no começo.

Cinco camadas para ler a economia da IA: energia, chips, infraestrutura, modelos, aplicações.
A leitura dele: a camada de aplicações ainda nem começou. Chatbot não é o destino final.
Protocolos (MCP, A2A, ACP) vão fazer pela IA agêntica o que TCP/IP fez pela web. Quem dominar o protocolo, domina o jogo.

Henrique Savelli, Application Lead da Anthropic, começou com um número: 90% de todo código escrito hoje dentro da Anthropic é escrito por agentes. Ele usou isso para apresentar o portfólio enterprise da empresa (Claude Code para devs, Cowork para os times não técnicos, Claude Design para a parte visual) e fechou anunciando o Managed Agents ao vivo, uma camada totalmente gerenciada que roda na infraestrutura da própria Anthropic.

Framework de três perguntas antes de construir um agente: o entregável está bem definido? O contexto é conectável? Revisar é mais rápido do que refazer? Três sins, caso de agente de verdade.
Equação que ele usa internamente: agente = modelo + harness. Engenharia de harness deixou de ser só trabalho de produto na Anthropic. Virou prioridade de pesquisa.
Casos públicos que ele citou: a Novo Nordisk reporta 90% de redução no tempo de documentação regulatória, a ServiceNow 95% na preparação dos times de venda, a Quanti 90% no tempo de proposta comercial.

Priscyla Laham, Presidente da Microsoft Brasil, organizou a aposta da Microsoft em torno do conceito de “Frontier Firm”: empresas operadas por IA e lideradas por humanos. O recado dela para devs e executivos na sala foi direto: IA é amplificador. O objetivo de negócio não muda. A composição da força de trabalho muda.

Três estágios de maturidade de IA dentro da empresa: assistente, agentes especialistas, agentes autônomos com supervisão humana.
40% do desenvolvimento de software dentro da Microsoft já é feito por agentes. Sem demissão por causa disso; 4x mais velocidade de entrega de features.
O Azure AI Foundry hospeda mais de 11.000 modelos. A aposta estratégica que ela defendeu é interoperabilidade e abertura, porque o modelo que vai ser referência daqui a seis meses não é o que você está usando hoje.

Justin Liu, Cofundador e Chief Architect da Genspark, já trabalhou no Google, Facebook e na Xiaodu Technology, da Baidu. A empresa, liderada pelo CEO Eric Jing, alcançou US$ 50 milhões em ARR (receita anual recorrente) em até 5 meses após o lançamento e ultrapassou US$ 200 milhões em 11 meses. Em março de 2026, atingiu uma avaliação de US$ 1,6 bilhão. Ele usou a escala de cinco níveis de AGI da OpenAI para argumentar que a maior parte das empresas hoje está parada entre o nível 1 (chatbot) e o nível 3 (agente de verdade). A tese técnica dele: agente de horizonte longo precisa de memória durável que vive fora da janela de contexto.

Agente durável precisa de três coisas: ação, continuidade, memória. A maior parte dos agentes de código hoje só lida com memória de janela de contexto, e essa colapsa depois de uns 30 minutos.
Categoria nova de cargo para acompanhar no LinkedIn: “10x AI specialist”. O humano que para de esperar definição pronta e começa a rodar experimento.
IA não consegue assumir responsabilidade de ponta a ponta. O humano segue sendo o responsável. Permissão, rastreabilidade e auditoria têm que ser desenhadas com isso em mente.

Piero Franceschi, CEO da StartSe, entregou menos um update técnico e mais uma provocação: quem a gente vira quando as máquinas são mais produtivas do que a gente? Ele avisou que “IA generativa pode virar IA degenerativa” quando a gente terceiriza memória, atenção, conhecimento e tomada de decisão. O recorte que importa para devs: skill técnica sozinha não basta mais.

Três traços humanos que diferenciam num mundo de agentes: coragem, inventividade, diálogo.
Padrão de prompt que ele recomenda: pensa 15 minutos no papel antes de abrir o modelo. Depois, usa o modelo para pressionar seu raciocínio, não para te deixar mais confortável.
Produtividade e inteligência estão se desacoplando. Ser produtivo deixou de exigir ser inteligente, e isso muda qual tipo de qualidade humana o mercado vai recompensar.

Eduardo Villalba, Head de Marketing da ElevenLabs Brasil, traçou um caminho que começa no jingle “tan tan tan tan” da Intel, passa pelo ruído de abertura da HBO e pelo “Tudum” da Netflix e chega nas vozes sintéticas de hoje. O argumento dele: voz está virando interface primária de marca. Em especial no Brasil, que, segundo os dados que ele mostrou, manda 4x mais áudio no WhatsApp do que a Índia.

Pilares de voice design: quem está falando, como soa, como se move pela conversa, e onde a interação acontece.
Ciclo de produção: briefing, prompt, teste, refinamento, implementação.
Alerta que ele deixou: construir voice AI só para “parecer moderno” entrega uma URA mais bonita. Empatia e personalidade têm que entrar como decisão deliberada de design.

Peter Danenberg, Senior Software Engineer do Google DeepMind, trabalhou em Google Assistant, Bard e Gemini por quase uma década. A palestra dele foi a mais pessoal do dia. Ele contou a história da mãe trabalhando para o ChatGPT, literalmente meses de trabalho não remunerado, etiquetando 50.000 fotos de família e pedidos da Amazon para uma IA que, no fim, não entregou o relatório prometido. Usou a história para apresentar a ideia de “inversion of control” (humano trabalhando para IA, em vez do inverso) e mostrou como inverter o jogo com um stack de agente pequeno, mas capaz.

Rafael Siqueira, sócio da McKinsey & Company, lidera o Build by McKinsey na América Latina. A tese dele: a maior parte das empresas ainda trata IA como ferramenta, quando na prática é uma transformação de como software é construído. Ele desenhou o ciclo de desenvolvimento novo (humanos orquestram, agentes executam) e as mudanças de organização que vêm junto.

Humanos orquestram, agentes executam. O dia de trabalho se estica para 24 horas porque os agentes seguem rodando enquanto você dorme (ele mantém quatro janelas de Claude Code e Codex rodando em paralelo em casa).
Nova forma do time: 3 a 5 builders entregando de ponta a ponta entregam mais do que o squad multidisciplinar de 8 a 12 pessoas da era anterior. Spec entra no lugar de ticket. Intenção entra no lugar de documentação.
Funções novas no organograma: Agent Ops, AI Risk, security engineering para agentes. As trilhas tradicionais de QA, DevOps e especialização se reorganizam em torno delas.

Lucas Leung, Diretor da Oracle, afinou a separação Vibe Coding vs Vibe Engineering que o Rafael tinha apresentado. Em uma frase: Vibe Coding é improviso com LLMs (stand up comedy). Vibe Engineering é construir sistema estruturado, pronto para produção, com LLMs no fluxo (filme inteiro). A mudança de disciplina: do “funcionar na demo” para o “escalar em produção”.

Vibe Coding entrega código que parece pronto. Vibe Engineering entrega sistema que para em pé.
Velocidade sem controle esconde risco. Vibe Coding esconde o risco. Vibe Engineering traz o risco à tona.
LLM assistido não é a mesma coisa que improvisado. Estrutura, teste e arquitetura continuam importando.

Isabella Piratininga, Diretora de Tecnologia e Inovação do iFood, apresentou o que provavelmente é um dos maiores deploys de produto agêntico em produção no Brasil: o Ailo, agente conversacional do iFood, já atendendo uma fatia dos 65 milhões de usuários ativos da plataforma. O ponto que ela repetiu: mudança de comportamento é o gargalo de verdade, e produto agêntico tem que ser tratado como replataforma.

Cinco princípios de produto que ela apresentou: confiança (construída em micro vitórias), custo por tarefa em vez de custo por token, determinismo (não usar reasoning onde dá para fazer rota), evals no meio da cadeia (não só na entrada e na saída) e onboarding (pequenas vitórias consistentes e repetidas).
Fazer pedido no iFood pelo Ailo é até 50% mais rápido do que pelo app tradicional. Cerca de 2 milhões de usuários experimentaram; 200 mil ativos por mês.
Recado para quem constrói: agente não é mais uma feature no roadmap. Planeje pelo menos uma reescrita. A arquitetura do Ailo já foi refeita uma vez e vai ser refeita de novo.

Marcelo Braga, Presidente da IBM Brasil, fechou o dia 1 com o playbook de IA enterprise da IBM. Ele ancorou a fala no estudo IBM Enterprise 2030, do IBM Institute for Business Value, e percorreu os cinco temas que a IBM apresentou na semana anterior no Think 2026, em Boston: desenvolvedores nativos de IA, gestão de identidade de agentes, AIOps multi-nuvem, soberania e dados. Também mostrou o IBM Bob (plataforma de desenvolvimento agêntico que ficou disponível para todos no Think) e citou a aquisição recém-fechada da Confluent (empresa por trás do Apache Kafka, em torno de US$ 11 bilhões) como aposta da IBM em dado em tempo real para IA.

A janela entre descoberta de bug e ataque ativo encolheu. Vulnerabilidade descoberta de manhã vira ataque de tarde. Pipeline de produção tem que testar o caminho negativo e entregar correção no mesmo dia.
Gestão de identidade de agentes virou o próximo problema difícil. Dar usuário e senha para um agente funciona até um prompt injection virar o agente contra você. Permissão precisa ser escopo por contexto, volume de transação, janela de API e horário do dia.
Token FinOps virou preocupação operacional. Update de uma página vira relatório de dez páginas, que volta pelo modelo para ser comprimido. Multiplica isso por cada projeto e cada time, e o problema de visibilidade chega antes da fatura.

Dia 2 começa em algumas horas. Em breve, volto com mais.

You may also like...

Simplificando o deploy de código Java no Kubernetes usando Quarkus

O guia definitivo de estudos para quem quer ser especialista em Java no backend

Os segredos de mentoria para quem usa Java no backend