Quando a indústria da gestão da informação não estruturada começou a sair do mundo analógico (papel e microfilme) na década de 80, a imagem digital foi o primeiro passo. Na década de 90, com a popularização dos PCs e sua capacidade de gerar grandes volumes de documentos digitais, novas funcionalidades foram surgindo, criando o mercado do EDM (Electronic Document Management) traduzido no Brasil como GED (Gerenciamento Eletrônico de Documentos). Na década de 2000 a Internet revoluciona a forma de disponibilização da informação através da separação entre conteúdo e forma de apresentação, trazendo novas necessidades, supridas com o ECM (Enterprise Content Management) ou GCC (Gestão do Conteúdo Corporativo).
[private] No início de mais uma década estamos começando um novo ciclo tecnológico. Novos desafios se apresentam, como a gestão de conteúdo em redes sociais, o uso cada vez maior de dispositivos móveis (quem acompanha os números do mercado de tablets sabe do que estamos falando) e, principalmente, a possibilidade de converter conteúdo não estruturado em conteúdo estruturado, ou seja, processável pelos tradicionais sistemas de processamento de dados.
Talvez uma das formas mais fáceis de tornar este fenômeno palpável é explorar o novo site da Folha de São Paulo – https://acervo.folha.com.br – onde se encontra o acervo digitalizado de jornais do grupo dos últimos 90 anos. Obviamente os últimos anos já estavam em arquivos digitais pesquisáveis, mas edições da década de 30 não eram disponibilizadas. Em um trabalho memorável, a Folha digitalizou todo o acervo com resolução que permitisse o uso de algoritmos de OCR sobre essas imagens, gerando um banco de dados que permite pesquisar todo o texto. Os novos usos que poderão ser dados a este acervo dependem somente da imaginação. Com o uso de ferramentas de mineração de texto e BI – Business Intelligence, podem ser feitas extrações e análises de informações que até há pouco tempo não eram imaginadas.
Esta revolução dos acervos faz com que a indústria passe a se intitular EIM (Enterprise Information Management ou Gestão da Informação Corporativa), já que as linhas entre o conteúdo estruturado e não estruturado ficam cada vez mais tênues. Trechos de um arquivo XML de um documento podem ser utilizados como conteúdo estruturado (lembrando que boa parte das ferramentas de produtividade hoje gera documentos nesse formato); padrões de imagens e de sons podem ser reconhecidos (consequentemente, estruturados). A ex-CEO da XEROX, Anne Mulcahy, já afirmou que “conteúdo não estruturado é estúpido e antiquado. É caro, complexo e não gera vantagem competitiva.” A sua afirmativa aponta exatamente para a conversão de conteúdo não estruturado em conteúdo estruturado permitindo novos usos e, consequentemente, mais ganhos com a adoção da tecnologia.
Usando a linha de raciocínio do XML como exemplo. Qual a diferença entre um arquivo de dados exportados em XML e uma nota fiscal eletrônica ou um arquivo de editor de textos salvo nesse formato?
Os novos desafios que estão por trás dessa convergência tecnológica são grandes e já abordamos anteriormente. Em breve, quem será o responsável pela informação nas organizações? O CIO (Chief Information Officer) ou o CKO (Chief Knowledge Officer) ou o RM (Records Manager) responsável pelos arquivos intermediários e inativos?
Que desenho deverá ter a arquitetura corporativa para suportar de forma integrada a gestão de repositórios de conteúdo estruturado e não estruturado? Imagine que o usuário vai querer ter em um único ponto de acesso os telefonemas, imagens de documentos, arquivos de dados e e-mails associados a uma determinada transação de negócio, obtidos através de um único argumento de pesquisa.
As organizações precisam se preparar para entrar efetivamente na Era da Informação onde não existem mais fronteiras entre tipos de conteúdo e tecnologias, com reflexos não só nas formas de fazer negócio, mas também nas estruturas organizacionais. [/private]
* Texto escrito por Walter W. Koch, diretor da ImageWare. Consultor internacional em Gestão Documental e TI. Professor dos cursos de pós-gradução da Fesp e Unip. Implementou alguns dos maiores projetos do País. Ministra cursos em diversos países da Europa, África e Oriente Médio. Autor do livro Electronic Document Management - Concepts and Technologies publicado em Dubai em 2001. Responsável pelo Treinamento da AIIM no Brasil.