DADOS... PASSADO, PRESENTE E FUTURO

DADOS... PASSADO, PRESENTE E FUTURO

"DADO"... há quem pense imediatamente num objeto cúbico com diferentes marcações em cada um dos seus 6 lados...

Mas só nesta frase acima temos 9 (nove) DADOS, por exemplo:

Categoria: objeto físico
Forma: cúbica
Faces: 6 (seis)
Conteúdo 1ª face: "1"
Conteúdo 2ª face: "2"
Conteúdo 3ª face: "3"
Conteúdo 4ª face: "5"
Conteúdo 5ª face: "8"
Conteúdo 6ª face: "13"
Portanto, um DADO é um valor ou ocorrência em seu estado bruto, com significado mínimo sem o adequado contexto.

Imagine o número 5 por si só... sabe-se que é um número, mas só isso... porém, o que ele representa? - sem um contexto e, geralmente, sem a ligação com outros dados (sua unidade, por exemplo), este DADO é simplesmente isso... um DADO.

Com a evolução dos computadores e dos sistemas de gerenciamento de bancos de DADOS, o DADO em si já não é tão bruto assim. O DADO quando coletado é armazenado numa base de DADOS (contexto - a base de DADOS do ERP de uma empresa), dentro de uma tabela (finalidade - itens de compra), num determinado campo (significado - quantidade do item pedido). Tudo isso que se sabe agora a mais sobre este mesmo número 5, dá-se o nome de METADADOS.

METADADOS são DADOS adicionais sobre os DADOS coletados - DADOS existentes por conta da própria arquitetura da base de DADOS ou, DADOS adicionados intencionalmente aos campos dos DADOS coletados.

A área de TI já foi conhecida como PROCESSAMENTO DE DADOS... mas apesar do nome ter mudado, é isso que é feito até os dias hoje! Tecnologia da Informação, Sistemas de Informação, Mineração de DADOS, Inteligência Artificial, Big Data, etc... quase tudo que é feito com a computação, de forma geral estará fazendo PROCESSAMENTO DE DADOS, com o intuito de extrair informações, principalmente para o auxílio em tomadas de decisão.

Surge então uma dúvida cruel:

Por que Processamento de DADOS, Banco de DADOS, Ciência de DADOS?! - Por que não Processamento de Informações, Banco de Informações e Ciência de Informações?!


PASSADO

Os bancos de DADOS possuem bases de DADOS com cada vez mais DADOS coletados...

O que fazer então com estes DADOS?!

Apesar de várias ações de Análise de DADOS terem sido executadas como razão óbvia ao armazenamento de DADOS (principalmente nas décadas de 70 e 80), Usama Fayyad, Gregory Piatetsky-Shapiro e Padhraic Smyth (1996) consolidaram efetivamente os conceitos e passos do KDD - Knowledge Discovery in Databases (Descobrimento de Conhecimento em Bases de Dados).

"...KDD se preocupa com o desenvolvimento de métodos e técnicas para compreender os DADOS." [...] "...KDD se refere ao processo completo de descobrimento de conhecimento útil, a partir dos DADOS,..."
Passos:

1 - Seleção - separar os DADOS-alvo que efetivamente serão utilizados
    dos DADOS disponíveis

2 - Pré-processamento - preparar os DADOS-alvo para análise,
    tornando-os DADOS-préprocessados

3 - Transformação - converter, extrair e adicionar DADOS aos
    DADOS-préprocessados, tornando-os DADOS-transformados

4 - Mineração de DADOS (Data Mining) - descobrir e extrair padrões
    a partir dos DADOS-transformados

5 - Interpretação/Avaliação - gerar conhecimento através
    dos padrões gerados

Mas o que isso tem a ver com o passado, se o KDD se mostra sendo aplicado mais do que nunca no presente?!

É que tanto o KDD como diversas outras ações de Análise de DADOS buscavam o conhecimento passado (DADOS de períodos anteriores), ou seja, o que aconteceu? - por que aconteceu? - como aconteceu?

A partir deste conhecimento buscava-se tomar ações para que determinadas coisas não acontecessem mais (na maioria das vezes), ou que acontecessem com maior frequência (caso fosse algo bom para a empresa).

O fato é que se analisava os DADOS do passado para se aprender sobre o PASSADO!


PRESENTE

A década de 90 massificou o uso de bancos de DADOS em Data Warehouses e Data Marts, alimentados por sistemas que também organizavam dados como ERP, CRM e BPM.

O alto investimento neste tipo de infraestrutura se deu por conta da necessidade da alta gestão conseguir um suporte mais imediato às tomadas de decisão, o BUSINESS INTELLIGENCE (ou simplesmente B.I.), analisando desde DADOS passados até os DADOS cada vez mais próximos do presente, através de diversos indicadores (KPIs) e a relação entre os mesmos.

Atualmente, com o BIG DATA, faz-se a Análise Descritiva dos DADOS (a compreensão em tempo real dos acontecimentos, como as DADOS são) e, a Análise Diagnóstica (para compreender as causas - quem, quando, como, onde e por quê - dos acontecimentos, o impacto nos DADOS).

Dashboards são criados para concentrar o conhecimento sobre a empresa e entregar os DADOS certos, para a pessoa certa, na hora certa.

Portanto, o foco muda, a necessidade está em analisar os DADOS do passado para se saber mais sobre o PRESENTE!


FUTURO

Inteligência Artficial... apesar do termo ter sido cunhado por John McCarthy em 1956, numa conferência no Dartmouth Colege, o primeiro trabalho reconhecido como IA foi o de McCulloch e Pitts em 1943 sobre "nerônios artificiais".

Sem entrar em detalhes sobre a evolução da IA e suas classificações, a implementação massiva de IA atualmente com Redes Neurais Artificiais, Machine Learning e Deep Learning é - na verdade - Inteligência Computacional, algoritmos aplicados a massas de DADOS (em especial BIG DATA) para detecção de padrões e, de generalização do comportamento dos DADOS.

A Inteligência Computacional (IC) é voltada para o aprendizado de tarefas muito específicas e tem mostrado excelentes resultados na aplicação - principalmente - de Análises Preditivas e Prescritivas dos DADOS.

A Análise Preditiva aponta como os DADOS serão e/ou se comportarão no futuro em condições diversas. Já a Análise Prescritiva gera recomendações para alcançar melhores resultados.

Aqui os DADOS do passado servirão de base para prever o FUTURO!


ATEMPORAL

Note que sempre são DADOS sendo processados...

Compartilho com a opinião de diversos outros autores e profissionais da área de TI que, a INFORMAÇÃO só existe no momento em que alguém lê ou visualiza (os DADOS) e dá um significado (particular ou coletivo) a eles.

Portanto, a INFORMAÇÃO só existe diante da percepção, entendimento e compreensão dos DADOS pelo ser humano, e não (ainda) pelas máquinas ou softwares.

Esta é a razão por que é Processamento de DADOS, Banco de DADOS, Ciência de DADOS...

Aqui ainda vale um aviso: com o aumento do processamento automático de DADOS, a qualidade dos mesmos durante cada parte do processo deve ser motivo da mais alta preocupação, afinal...

O NÃO COMPROMETIMENTO COM A QUALIDADE DOS DADOS IRÁ - com certeza - COMPROMETER QUAISQUER ANÁLISES EFETUADAS


JSI:.














Entre para ver ou adicionar um comentário

Outros artigos de Juliano Ignacio

Outras pessoas também visualizaram

Conferir tópicos