Dados de baixa qualidade: comoeles influenciam no sucesso (ou não) de um modelo de IA

A inteligência artificial (IA) se tornou peça fundamental nas empresas. No Brasil, 41% das companhias já integraram a IA às suas operações, de acordo com pesquisa encomendada pela IBM em 2022. Ainda assim, pouco se discute sobre como a qualidade dos dados pode influenciar no sucesso da abordagem.

Embora seja difícil mensurar o impacto da questão, um artigo publicado pela MIT Sloan Management Review sugere que é possível uma organização perder em torno de 15% a 25% em sua receita como resultado de uma baixa qualidade de dados. Da mesma forma, a Gartner, uma das principais empresas de consultoria em tecnologia, estima que as perdas anuais podem chegar até US$ 15 milhões (cerca de R$ 75 milhões).

Como se diferencia um dado bom de um ruim? De acordo com Matheus Vill, CTO da Neoway, maior empresa de Data Analytics e Inteligência Artificial da América Latina, são diversas questões. Uma delas ocorre quando há uma quantidade insuficiente de dados para a modelagem de treinamento da IA: isso porque, em essência, algoritmos de IA e machine learning precisam trabalhar com uma soma gigantesca de informações para reconhecer padrões de análise corretos e influir em investimentos.

“Discute-se muito sobre IA, mas a qualidade dos dados recebe pouca atenção”, explica Matheus Vill. “Insumos bons desempenham um papel fundamental na tomada de boas decisões. Não há IA generativa com dados de péssima qualidade; no fim, o que ele gera são informações ruins. Pode ser o melhor modelo do mundo.”

Compilar bons dados, ao mesmo tempo, é um desafio semelhante. “Quanto maior a amostra, mais preciso será o modelo. No entanto, a alta variação de um conjunto de dados pode resultar em um conjunto excessivamente complexo. Neste sentido, os datasets precisam conter informações suficientes para iterar com a IA sem introduzir ruídos desnecessários no modelo”, completa o especialista.

Share This Post

Post Comment