OCR No N8n: A Forma Mais Eficaz De Usar Documentos Como Base De Conhecimento (RAG)

Créditos para a Autotic
#OCR #n8n #forma #mais #eficaz #usar #documentos #como #Base #Conhecimento #RAG

8 Comment on this post

@jonathandacruz 26/06/2025 em 19:00

Comentar

De forma geral, quando um PDF está em formato tabular (com marcações estruturadas), a extração de dados é bem mais simples. Já nos casos em que o arquivo foi salvo como imagem, uma das melhores soluções é usar o Google Document AI. Com ele, é possível rotular as imagens e treinar um processador personalizado para extrair as informações corretamente.
@jefercceloisa 26/06/2025 em 19:00

Comentar

Fiquei um bom tempo descobrindo como mexer com OCR, pouca informação no YouTube, pra dizer nada, consegui fazer com o vison da Google a extrair toda documentação que envio tanto PDF e imagens, o mistral se perde muito quando mando aqueles PDF que tem imagem, exemplo uma cnh que baixa do sistema do Detran nao reconhece, vejo o mistral para negócios que trabalham com PDF puros e so imagens também, mais na minha experiência com OCR o vision ainda e imbatível, e nao tem ninguém que fale do vison vison,
@reactzadagtarp7824 26/06/2025 em 19:00

Comentar

faltou abaixa um pouco a musica
@edneiprocopio 26/06/2025 em 19:00

Comentar

Aula excelente! Gostei!
@marcelo.s.aguiar 26/06/2025 em 19:00

Comentar

Parabens pelo vídeo. usar arquivos para base de conhecimento não gastará muito mais tokens do que base vetorial em banco de dados? Num projeto de alta escalabilidade, ficaria uma pancada de consumo de tokens, não?
@felipevogas9378 26/06/2025 em 19:00

Comentar

Eu utilizei a API da Mistral no n8n para realizar a extração de dados de faturas de cartão de crédito corporativo. No entanto, notei que havia páginas específicas que o Mistral simplesmente não transcrevia. Ao analisar as mensagens de retorno, percebi que a API estava interpretando algumas dessas páginas não como PDFs, mas sim como imagens, o que impedia a extração dos dados. Por se tratarem de faturas de cartão de crédito corporativo, todas as páginas seguem o mesmo padrão de formatação e não achei explicação para o fato dele do nada achar que é uma imagem.
@inzaubraldebrasil9492 26/06/2025 em 19:00

Comentar

ué eu faço isso usando o gemini
@samu_el77 26/06/2025 em 19:00

Comentar

Muito bom esse novo estilo dos vídeos, professor! Ficou top! Só senti falta da clássica abertura: 'Fala, automatizador!' 😂 Obrigado por sempre compartilhar tanto conhecimento e entregar o ouro pra gente!"

OCR no n8n: A forma mais eficaz de usar documentos como Base de Conhecimento (RAG)

8 Comment on this post

Join the conversation Cancelar resposta