Olá, como podemos ajudar?

Pesquisas recentes: Configuração - 2.2.3 - Formulário - 2.2.3 - Data lab - 2.2.3 - Analytics - 2.2.3

Cadastrar o perfil de reconhecimento

cap_azul_1_por.png
cap_azul_2_por.png
cap_meio_3_por.png
cap_meio_4_por.png

 

Pré-requisitos

  • Acesso ao menu Cadastro > Perfil de reconhecimento (CAP004).
  • Tipo de perfil de reconhecimento previamente cadastrado.

 

Apresentação

Através do perfil de reconhecimento é possível reconhecer trechos do documento capturado, permitindo, entre outras coisas, a exportação de informações do arquivo capturado para propriedades do documento registrado no SoftExpert Documento.

Para este cadastro, é necessário um arquivo de exemplo no formato .pdf ou uma imagem para definir os índices.

Veja um exemplo prático do cadastro do perfil de reconhecimento:

 

Visão geral da tela do perfil de reconhecimento

Antes de prosseguir com o cadastro, é importante entender como a tela do perfil de reconhecimento está dividida:

A opção Binarizar a imagem para fazer OCR faz com que a imagem do lote seja convertida em preto e branco antes de qualquer operação de OCR. Por exemplo, se a imagem utilizada for colorida ou escala de cinza, quando for executada uma etapa da captura onde for necessário realizar o OCR, o sistema binarizará a imagem, fará o OCR e em seguida, descartará a imagem em preto e branco, mantendo a imagem colorida.

 

Barra de ferramentas - Painel de visualização

Clique neste botão e na tela que será aberta, localize e selecione a imagem que será utilizada para configurar o perfil de reconhecimento.

Clique neste botão para digitalizar o arquivo a partir do qual será configurado o perfil de reconhecimento. Para que este recurso funcione corretamente, é necessário ter um scanner com suporte ao padrão TWAIN instalado.
Caso houver mais de um scanner instalado, será apresentada a tela para selecionar o scanner desejado. Em seguida, será aberta a tela do driver TWAIN do scanner selecionado para configuração da digitalização.

Clique neste botão para aumentar o tamanho da visualização da imagem importada.

Clique neste botão para diminuir o tamanho da visualização da imagem importada.

Clique neste botão para ajustar o tamanho da visualização da imagem importada ao painel de pré-visualização.
Editar imagem Clique neste botão para tratar a imagem apresentada no painel de visualização. Veja mais detalhes sobre esta opção no tópico a seguir.
 
 

Editar imagem

Depois de clicar no botão Editar imagem, da barra de ferramentas do painel de visualização, será aberta uma tela que permite fazer alterações na imagem do documento.

Na tela, as seguintes opções estão disponíveis:

Clique neste botão para acionar o recurso da "mão", que permite clicar e arrastar, percorrendo a imagem.
Clique neste botão para diminuir o nível de zoom da imagem.
Clique neste botão para aumentar o nível de zoom da imagem.
Clique neste botão para ajustar o nível de zoom da imagem ao painel de pré-visualização.
Clique neste botão para inverter as cores da imagem. Por exemplo: em uma imagem com fundo branco e texto na cor preta, o fundo passará a ser preto e o texto na cor branca.
Clique neste botão para ajustar o brilho da imagem.
Clique neste botão para girar a imagem 90 graus no sentido horário.
Clique neste botão para girar a imagem 90 graus no sentido anti-horário.
Clique neste botão para selecionar uma área da imagem e recortá-la, de forma que a imagem contenha somente a seleção recortada.
Clique neste botão para binarizar a imagem, ou seja, convertê-la para preto e branco. Neste momento, será apresentado um campo para selecionar a técnica de binarização que deseja aplicar à imagem.
Clique neste botão para ajustar o alinhamento da imagem, caso ela esteja apresentando desvios durante o processo de digitalização.
Clique neste botão para remover as sujeiras, pontos indesejados ou outros ruídos que possam ter sido introduzidos na imagem durante o processo de digitalização.
Clique neste botão para remover as linhas presentes na imagem (tanto as originais do arquivo, quanto àquelas que porventura foram introduzidas durante o processo de digitalização). Lembre-se que a presença de linhas na imagem, em especial linhas verticais, podem interferir no processo de OCR.
Ao clicar neste botão, o sistema detecta e remove automaticamente a borda da imagem para melhorar sua definição
Clique neste botão para aplicar o filtro Median na imagem para redução dos ruídos (especialmente ruídos "sal-e-pimenta"). O filtro Median substitui a intensidade de cada pixel pela mediana das intensidades dos pixels adjacentes, reduzindo a quantidade de variação da intensidade entre um pixel e outro.

Utilize a opção Aplicar para salvar o tratamento realizado na imagem. 

Utilize o botão Cancelar, para sair da tela de edição de imagem sem aplicar as alterações.

 
 

 

Cadastrar o perfil de reconhecimento

1. Acesse o menu Cadastro > Perfil de reconhecimento (CAP004).

2. Clique no botão .

3. Selecione o Tipo de perfil de reconhecimento e clique no botão .

4. O navegador solicitará permissão para abrir o aplicativo externo. Habilite o campo “Sempre permitir que _____.softepxert.com abra esse tipo de link no app associado” e clique no botão Abrir URIGeneric.

5. Na tela que será aberta, preencha as informações necessárias e crie os índices do perfil. 

Para mais detalhes sobre o preenchimento das informações, confira o vídeo:

Ao abrir uma aplicação que é externa ao navegador, poderá ser solicitada a permissão para executá-la. Para mais informações, leia o tópico Execução de aplicativos externos.

Verifique com o administrador do seu sistema se o seu ambiente tem o FileManager devidamente configurado.

• Para mais informações sobre como montar expressões regulares, clique aqui.

 

Regras de validação

Selecione uma das seguintes opções para definir o conjunto de caracteres que serão reconhecidos no índice:

Nenhuma regra: Não será aplicada uma regra de validação ao índice.

Data: Somente serão aceitos valores do tipo data. No campo Formato, selecione a opção correspondente ao formato da data que será reconhecido.

Caracteres aceitos: Somente um conjunto específico de caracteres será reconhecido no índice. No campo Opções de inclusão, selecione a opção correspondente para que sejam reconhecidos: todos os números, todas as letras, todos os caracteres especiais ou para personalizar o conjunto. Neste caso, no campo "Personalizado", informe os caracteres que serão considerados.

Caracteres ignorados: Um conjunto específico de caracteres não será reconhecido no índice. No campo Opções de exclusão, selecione a opção correspondente para que não sejam reconhecidos: todos os números, todas as letras, todos os caracteres especiais ou para personalizar o conjunto. Neste caso, no campo "Personalizado", informe os caracteres que não serão considerados.

Número: Somente serão aceitos valores do tipo data. No campo “Separador decimal”, informe qual separador decimal será considerado.

 
 

 

Conclusão

Assim, com o perfil de reconhecimento devidamente configurado, é possível associá-lo à configuração da captura.


Este artigo foi útil?