6 principais questões de qualidade dos dados que assombram quase todas as grandes organizações

com o advento da socialização dos dados e da democratização dos Dados, Muitas organizações organizam, partilham e disponibilizam a informação de forma eficiente a todos os trabalhadores. Enquanto a maioria das organizações lucra com o uso liberal de tais minas de informação ao alcance dos seus empregados, outros enfrentam problemas com a qualidade dos dados por eles utilizados.Como a maioria das organizações também olha para a implementação de sistemas com inteligência artificial ou conectando seus negócios através da internet das coisas, isso se torna especialmente importante.

analistas de negócios determinam tendências de mercado, dados de desempenho e até mesmo apresentam insights para executivos que irão ajudar a dirigir o futuro da empresa. E à medida que o mundo se torna ainda mais orientado por dados, é de vital importância para os analistas de negócios e dados terem os dados certos, na forma certa, na hora certa para que eles possam transformá-los em insight.

o modelo básico que uma empresa segue ao implementar a socialização de dados é:

socialização de dados

no entanto, muitas vezes, os analistas de negócios acabam gastando a maioria de seu tempo focado na qualidade dos dados. Este é um problema porque a preparação e gestão de dados não é a principal responsabilidade do analista de negócios. Mas também não precisam de depender disso para o fazer por eles.Algumas das questões mais comuns relacionadas com a qualidade dos dados enfrentadas pelos analistas e organizações em geral são::

duplicatas

múltiplas cópias dos mesmos registros têm um preço sobre o cálculo e armazenamento, mas também podem produzir insights distorcidos ou incorretos quando não são detectados. Um dos principais problemas pode ser o erro humano — alguém simplesmente inserir os dados várias vezes por acidente-ou pode ser um algoritmo que correu mal.

um remédio sugerido para este problema é chamado de “deduplicação de dados”. Esta é uma mistura de insight humano, processamento de dados e algoritmos para ajudar a identificar potenciais duplicados com base em pontuações de probabilidade e senso comum para identificar onde registros parecem uma correspondência próxima.

dados incompletos

muitas vezes porque os dados não foram introduzidos no sistema corretamente, ou certos arquivos podem ter sido corrompidos, os dados restantes tem várias variáveis em falta. Por exemplo, se um endereço não inclui um código postal em tudo, a informação restante pode ser de pouco valor, uma vez que o aspecto geográfico dele seria difícil de determinar.

formatos inconsistentes

se os dados são armazenados em formatos inconsistentes, os sistemas utilizados para analisar ou armazenar a informação podem não interpretá-la correctamente. Por exemplo, se uma organização mantém a base de dados dos seus consumidores, o formato de armazenamento das informações básicas deve ser pré-determinado. Nome( nome próprio, apelido), data de nascimento (estilo EUA/REINO UNIDO) ou número de telefone (com ou sem código do país) deve ser gravado no mesmo formato exato. Pode levar um tempo considerável para os cientistas de dados simplesmente desvendar as muitas versões de dados salvos.

acessibilidade

a informação que a maioria dos cientistas de dados usa para criar, avaliar, teorizar e prever os resultados ou produtos finais muitas vezes se perde. A forma como os dados se resumem a analistas de negócios em grandes organizações — de departamentos, sub-divisões, ramos e, finalmente, as equipes que estão trabalhando nos dados — deixa informações que podem ou não ter acesso completo ao próximo usuário.

o método de compartilhar e disponibilizar a informação de forma eficiente a todos os funcionários de uma organização é a pedra angular no compartilhamento de dados corporativos.

upgrades do sistema

cada vez que o sistema de gerenciamento de dados recebe uma atualização ou o hardware é atualizado, há chances de informações se perderem ou corromperem. É sempre aconselhável fazer vários back-ups de dados e atualizar os sistemas apenas através de fontes autenticadas.

purga e armazenamento de dados

com cada nível de gestão em uma organização, há chances de que a informação gravada localmente poderia ser apagada-por engano ou deliberadamente. Portanto, salvar os dados de uma forma segura, e compartilhar apenas uma cópia espelho com os funcionários é crucial. À medida que os usuários de negócios ficam frustrados por não conseguirem obter respostas quando precisam delas, eles podem desistir de esperar e voltar a voar às cegas sem dados. Alternativamente, eles podem ir desonestos e introduzir sua própria ferramenta de análise para obter os dados que eles exigem, o que pode criar uma fonte conflitante de verdade. Em ambos os cenários os dados perdem sua potência”, escreveu Brent Dykes.Se não for tomado o cuidado de evitar dados incorretos ou corruptos antes de analisá-los para decisões de negócios, a organização pode acabar perdendo oportunidades, receitas, sofrer de danos à reputação, ou até mesmo minar a confiança dos CXOs.O Que Achas?

Subscreva a nossa Newsletter

obtenha as últimas actualizações e ofertas relevantes partilhando o seu email. Junte-Se Ao Nosso Grupo De Telegramas. Faça parte de uma comunidade online envolvente. Junta-Te Aqui.

Deixe uma resposta

O seu endereço de email não será publicado.