F.A.Q

 

Dúvidas frequentes

Como adiciono um diretório além do CGTI para realização do OCR?

Crie o diretório em questão - recomenda-se seguir a estrutura atual, ou seja, /srv/shares/novoSetor/ocr/ - e crie o arquivo .watchmanconfig dentro de “entrada” com o texto {"settle": 10000}. Como também crie os diretórios "saída" e "originais". Após estas etapas, rode o comando de criação das triggers: Pronto, novo diretório para processamento OCR adicionado.


Como testar o OCR para um diretório que eu adicionei?

Apenas copie/envie o PDF para o servidor, fora do diretório .../ocr/entrada/. Então, logado no servidor via linha de comando, copie o PDF para dentro do diretório .../ocr/entrada que você criou anteriormente. O PDF será processado normalmente.


Existe algum log da solução OCR?

O arquivo de LOG presente em /var/log/ocr.log indica o estado de cada arquivo quanto ao seu processamento.


Como sei que o OCR está instalado?

Rode o comando: ocrmypdf --version

Deve aparecer um resultado similiar a: 5.7.0

Mensagens de comando não encontrado indicarão um problema na sua instalação, portanto, revise todas as etapas antes de continuar.


Como sei que o PDF está sendo processado no servidor?

O último estado no LOG para o arquivo em questão deve ser "Processando". Além disso, por meio do comando top, você deverá ver linha(s) com a execução de gs, tesseract ou ocrmypdf. Isto indica que um ou mais arquivos estão sendo processados.


Por que o processamento demora tanto em arquivos grandes?

Quanto maior o número de páginas ou características do documento escaneado, maior o tempo necessário para o processamento.


Existe alguma maneira de acelerar o processamento do PDF?

Incrementando a quantidade de cores e memória principal da sua VM é possível processar os arquivos PDFs em menor tempo.


O arquivo está recebido pela solução OCR mas não está sendo processado, o que pode estar acontecendo?

O watchman pode não estar ativo. Caso isso ocorra, rode o comando watchman watch-list e observe se os processamentos foram iniciados no log da solução OCR. Caso não haja entradas no log, verifique o log do watchman:

$ tail -f /usr/local/var/run/watchman/root-state/log.

Mensagens de erro podem ser consultadas no Google para dúvidas.

Caso o watchman esteja OK e ainda haja problemas para processar o arquivo, verifique se existe disco e memória suficientes para realizar esta operação.


Ao mover um arquivo PDF de dentro do próprio servidor, o OCR funciona. Mas enviando do meu usuário via rede (samba, sftp, outro meio) o OCR não acontece, o que posso verificar?

Problemas de permissão local. Siga as políticas definidas para o acesso aos diretórios e certifique-se de que ao enviar o PDF via rede, as permissões estejam adequadas e ajustadas para atender a sua política adotada no campus.

Adicionalmente, alguns softwares de envio de arquivos, ou mesmos os servidores de arquivos, possuem mecanismos para ajustar as permissões padrão para novos arquivos enviados.