A Stefanini, provedora global de soluções de negócios baseadas em tecnologia, por meio da Stefanini Document Solutions, empresa criada em 2009 e especializada na leitura e processamento automático de documentos, é premiada na ICFHR-2014 - 14th International Conference on Frontiers in Handwriting Recognition, conferência mundial em reconhecimento de escrita e processamento de documentos, que acontece na Grécia de 1 a 4 de setembro. A Stefanini Document Solutions foi premiada pela ferramenta de reconhecimento de valor em cheques.
A solução consiste em um sistema de reconhecimento de padrões complexos, que tem como entrada uma imagem de números escritos à mão que representam o valor (CAR) em um cheque ou em uma nota fiscal. Esta imagem de entrada é processada para que seja possível retirar dela toda impureza, como os ruídos decorrentes de marcas d’água ou textura proveniente de papel reciclado, mas ao mesmo tempo mantendo os pigmentos de tinta que correspondem aos dígitos.
As competições promovidas na ICFHR são extremamente criteriosas. Nesta competição em particular, todos os participantes tiveram acesso a um pequeno conjunto de imagens de exemplo para tomar como base e calibrarem os seus sistemas. Em seguida, os grupos enviaram seus sistemas para o comitê avaliador que realizou diversos testes com as soluções sobre milhares de imagens e aferiu as estatísticas de reconhecimento de cada solução, usando procedimentos e métricas normalmente usados na literatura científica da área. Desta forma, o ranking das soluções foi definido de maneira objetiva por um comitê de pesquisadores doutores de diversas universidades não correlatas aos participantes da competição.
De acordo com Byron Leite, um dos cientistas mentores da solução, esta é uma das etapas mais complexas para alguns tipos de documentos além de ser um grande desafio, especialmente se tratando dos cheques brasileiros. “Hoje o sistema conta com mais de 30 diferentes métodos de limpeza e pré-processamento de imagem para lidar com este desafio. Ao final desta etapa, obtemos uma nova imagem limpa e com apenas duas cores (preto e branco), que servirá de entrada para o módulo de classificação do sistema. Este módulo de classificação combina diversos modelos de reconhecimento de padrões de forma inteligente e adaptada ao contexto, sendo estes modelos fundamentados em técnicas diversas de Aprendizagem de Máquina e Aprendizagem Estatística, como é o caso das Redes Neurais”, afirma o executivo.
Sobre a aplicação da ferramenta, o executivo ressalta que este componente pode ser aplicado para o reconhecimento de números provenientes de qualquer documento ou mesmo foto. Para isso, a tecnologia é incorporada no sistema de reconhecimento de formulários e documentos estruturados, o DSIR (Document Solutions Image Recognition). Com isso, a tecnologia já é amplamente usada para reconhecimento de valores em cheques, em holerites, em formulários de abertura de conta ou em propostas de crédito. Além disso, a mesma tecnologia pode ser aplicada para reconhecimento de outros tipos de campo, como: datas, números de identificação pessoal (CPF, RG, CNH), códigos postais em endereços, números de propostas em formulários de seguro, entre outros. Esta tecnologia é decorrente de muitas pesquisas que foram amadurecendo ao longo dos últimos 15 anos até chegar ao estágio atual.
“Para continuar a evolução da tecnologia, a Stefanini Document Solutions investe de forma contínua em P&D com seu grupo de pesquisadores doutores e mestres, mas conta também com fortes parcerias com pesquisadores em reconhecimento de padrões e processamento de imagens nas academias e grupos de excelência nestas áreas em Pernambuco”, conclui o executivo.
A premiação é resultado de uma competição promovida dentro da maior conferência mundial em reconhecimento de escrita e processamento de documentos, a 14th International Conference on Frontiers in Handwriting Recognition, que tem o Google como um dos principais patrocinadores. Esta conferência é promovida a cada dois anos pela International Association for Pattern Recognition –IAPR.