De forma geral, quando um PDF está em formato tabular (com marcações estruturadas), a extração de dados é bem mais simples. Já nos casos em que o arquivo foi salvo como imagem, uma das melhores soluções é usar o Google Document AI. Com ele, é possível rotular as imagens e treinar um processador personalizado para extrair as informações corretamente.
Fiquei um bom tempo descobrindo como mexer com OCR, pouca informação no YouTube, pra dizer nada, consegui fazer com o vison da Google a extrair toda documentação que envio tanto PDF e imagens, o mistral se perde muito quando mando aqueles PDF que tem imagem, exemplo uma cnh que baixa do sistema do Detran nao reconhece, vejo o mistral para negócios que trabalham com PDF puros e so imagens também, mais na minha experiência com OCR o vision ainda e imbatível, e nao tem ninguém que fale do vison vison,
Parabens pelo vídeo. usar arquivos para base de conhecimento não gastará muito mais tokens do que base vetorial em banco de dados? Num projeto de alta escalabilidade, ficaria uma pancada de consumo de tokens, não?
Eu utilizei a API da Mistral no n8n para realizar a extração de dados de faturas de cartão de crédito corporativo. No entanto, notei que havia páginas específicas que o Mistral simplesmente não transcrevia. Ao analisar as mensagens de retorno, percebi que a API estava interpretando algumas dessas páginas não como PDFs, mas sim como imagens, o que impedia a extração dos dados. Por se tratarem de faturas de cartão de crédito corporativo, todas as páginas seguem o mesmo padrão de formatação e não achei explicação para o fato dele do nada achar que é uma imagem.
Muito bom esse novo estilo dos vídeos, professor! Ficou top! Só senti falta da clássica abertura: 'Fala, automatizador!' 😂 Obrigado por sempre compartilhar tanto conhecimento e entregar o ouro pra gente!"
De forma geral, quando um PDF está em formato tabular (com marcações estruturadas), a extração de dados é bem mais simples. Já nos casos em que o arquivo foi salvo como imagem, uma das melhores soluções é usar o Google Document AI. Com ele, é possível rotular as imagens e treinar um processador personalizado para extrair as informações corretamente.
Fiquei um bom tempo descobrindo como mexer com OCR, pouca informação no YouTube, pra dizer nada, consegui fazer com o vison da Google a extrair toda documentação que envio tanto PDF e imagens, o mistral se perde muito quando mando aqueles PDF que tem imagem, exemplo uma cnh que baixa do sistema do Detran nao reconhece, vejo o mistral para negócios que trabalham com PDF puros e so imagens também, mais na minha experiência com OCR o vision ainda e imbatível, e nao tem ninguém que fale do vison vison,
faltou abaixa um pouco a musica
Aula excelente! Gostei!
Parabens pelo vídeo. usar arquivos para base de conhecimento não gastará muito mais tokens do que base vetorial em banco de dados? Num projeto de alta escalabilidade, ficaria uma pancada de consumo de tokens, não?
Eu utilizei a API da Mistral no n8n para realizar a extração de dados de faturas de cartão de crédito corporativo. No entanto, notei que havia páginas específicas que o Mistral simplesmente não transcrevia. Ao analisar as mensagens de retorno, percebi que a API estava interpretando algumas dessas páginas não como PDFs, mas sim como imagens, o que impedia a extração dos dados. Por se tratarem de faturas de cartão de crédito corporativo, todas as páginas seguem o mesmo padrão de formatação e não achei explicação para o fato dele do nada achar que é uma imagem.
ué eu faço isso usando o gemini
Muito bom esse novo estilo dos vídeos, professor! Ficou top! Só senti falta da clássica abertura: 'Fala, automatizador!' 😂 Obrigado por sempre compartilhar tanto conhecimento e entregar o ouro pra gente!"