Início TECNOLOGIA Snowflake cria nova inteligência que vai além do RAG para consultar e...

Snowflake cria nova inteligência que vai além do RAG para consultar e agregar milhares de documentos de uma só vez

37
0

A IA empresarial tem um problema de dados. Apesar dos bilhões em investimentos e dos modelos de linguagem cada vez mais capazes, a maioria das organizações ainda não consegue responder a questões analíticas básicas sobre seus repositórios de documentos. O culpado não é a qualidade do modelo, mas a arquitetura: tradicional geração aumentada de recuperação (RAG) os sistemas foram projetados para recuperar e resumir, e não para analisar e agregar grandes conjuntos de documentos.

A Snowflake está enfrentando essa limitação de frente com uma estratégia de plataforma abrangente anunciada em sua conferência BUILD 2025. A empresa revelou o Snowflake Intelligence, uma plataforma de agente de inteligência empresarial projetada para unificar a análise de dados estruturados e não estruturados, juntamente com melhorias de infraestrutura que abrangem a integração de dados com Fluxo abertoconsolidação de banco de dados com Postgres de floco de neve e análises em tempo real com tabelas interativas. O objetivo: eliminar os silos de dados e os gargalos arquitetônicos que impedem as empresas de operacionalizar a IA em escala.

Uma inovação importante é o Agentic Document Analytics, um novo recurso do Snowflake Intelligence que pode analisar milhares de documentos simultaneamente. Isso move as empresas de pesquisas básicas como “Qual é a nossa política de redefinição de senha?” para consultas analíticas complexas como “Mostre-me uma contagem de menções semanais por área de produto em meus tickets de suporte ao cliente nos últimos seis meses.”

O gargalo do RAG: por que a amostragem falha na análise

Os sistemas RAG tradicionais funcionam incorporando documentos em representações vetoriais, armazenando-os em um banco de dados vetorial e recuperando os documentos semanticamente mais semelhantes quando um usuário faz uma pergunta.

“Para que o RAG funcione, é necessário que todas as respostas que você está procurando já existam de alguma forma publicada hoje,” Jeff Hollan, chefe dos agentes Cortex AI da Snowflake, explicou ao VentureBeat durante uma coletiva de imprensa. “O padrão que penso com o RAG é como um bibliotecário, você recebe uma pergunta e ela diz: ‘Este livro tem a resposta nesta página específica.'”

No entanto, esta arquitetura quebra fundamentalmente quando as organizações precisam realizar análises agregadas. Se, por exemplo, uma empresa tiver 100.000 relatórios e quiser identificar todos os relatórios que falam sobre uma entidade empresarial específica e somar todas as receitas discutidas nesses relatórios, essa não é uma tarefa trivial.

“Isso é algo muito mais complexo do que apenas o RAG tradicional,” Hollan disse.

Essa limitação normalmente força as empresas a manter pipelines analíticos separados para dados estruturados em data warehouses e dados não estruturados em bancos de dados vetoriais ou armazenamentos de documentos. O resultado são silos de dados e desafios de governação para as empresas.

Como o Agentic Document Analytics funciona de maneira diferente

A abordagem da Snowflake unifica a análise de dados estruturados e não estruturados em sua plataforma, tratando os documentos como fontes de dados consultáveis, em vez de alvos de recuperação. O sistema usa IA para extrair, estruturar e indexar o conteúdo do documento de forma a permitir operações analíticas semelhantes às do SQL em milhares de documentos.

O recurso aproveita a arquitetura existente do Snowflake. Cortex AISQL lida com análise e extração de documentos. Tabelas e armazéns interativos oferecem desempenho de consulta inferior a um segundo em grandes conjuntos de dados. Ao processar documentos na mesma plataforma de dados governada que abriga dados estruturados, as empresas podem unir insights de documentos com dados transacionais, registros de clientes e outras informações comerciais.

“O valor da IA, o poder da IA, a produtividade e o potencial disruptivo da IA ​​são criados e possibilitados pela conexão com dados empresariais,” disse Christian Kleinerman, vice-presidente executivo de produto da Snowflake.

A arquitetura da empresa mantém todo o processamento de dados dentro dos limites de segurança, abordando questões de governança que retardaram a adoção da IA ​​pelas empresas. O sistema funciona com documentos de múltiplas fontes. Isso inclui PDFs no SharePoint, conversas no Slack, dados do Microsoft Teams e registros do Salesforce por meio dos recursos de integração de cópia zero do Snowflake. Isso elimina a necessidade de extrair e mover dados para sistemas de processamento de IA separados.

Comparação com as abordagens atuais do mercado

O anúncio posiciona a Snowflake de forma diferente dos fornecedores tradicionais de data warehouse e das startups nativas de IA.

Empresas como a Databricks têm se concentrado em trazer recursos de IA para lakehouses, mas normalmente ainda dependem de bancos de dados vetoriais e padrões RAG tradicionais para dados não estruturados. A API Assistants da OpenAI e o Claude da Anthropic oferecem análise de documentos, mas são limitados pelos tamanhos das janelas de contexto.

Provedores de bancos de dados vetoriais como Pinecone e Weaviate construíram negócios em torno de casos de uso de RAG, mas às vezes enfrentam desafios quando os clientes precisam de consultas analíticas em vez de consultas baseadas em recuperação. Esses sistemas são excelentes na localização de documentos relevantes, mas não conseguem agregar facilmente informações em grandes conjuntos de documentos.

Entre os principais casos de uso de alto valor que antes eram difíceis com arquiteturas somente RAG que o Snowflow destaca por sua abordagem está a análise de suporte ao cliente. Em vez de revisar manualmente os tickets de suporte, as organizações podem consultar padrões em milhares de interações. Perguntas como “Quais são os 10 principais problemas de produto mencionados nos tickets de suporte neste trimestre, divididos por segmento de cliente?” torne-se responsável em segundos.

O que isso significa para a estratégia empresarial de IA

Para empresas que criam estratégias de IA, o Agentic Document Analytics representa uma mudança do “pesquisar e recuperar” paradigma do RAG para um “consultar e analisar” paradigma mais familiar das ferramentas de business intelligence.

Em vez de implantar bancos de dados vetoriais e sistemas RAG separados para cada caso de uso, as empresas podem consolidar a análise de documentos em sua plataforma de dados existente. Isso reduz a complexidade da infraestrutura e, ao mesmo tempo, estende as práticas de business intelligence a dados não estruturados.

A capacidade também democratiza o acesso. Tornar a análise de documentos consultável por meio de linguagem natural significa que os insights que antes eram exigidos pelas equipes de ciência de dados se tornam disponíveis para os usuários corporativos.

Para as empresas que procuram liderar em IA, a vantagem competitiva não advém de melhores modelos de linguagem, mas da análise de dados não estruturados proprietários em escala, juntamente com dados empresariais estruturados. As organizações que podem consultar todo o seu corpus de documentos com a mesma facilidade com que consultam o seu data warehouse obterão insights que os concorrentes não podem replicar facilmente.

“A IA é uma realidade hoje,” Kleinerman disse. “Temos muitas organizações que já obtêm valor da IA ​​e, se alguém ainda estiver esperando ou sentado à margem, nosso apelo à ação é começar a construir agora.”

avots