Seguindo a "modinha" do Data Science
Há alguns dias escrevi sobre o que julgo ser o principal papel de um cientista de dados: contar histórias. Pode parecer estranho, mas acredito que todos que leram puderam verificar o raciocínio para tal conclusão em "O contador de histórias (sobre o trabalho do cientista de dados)".
De uns tempos para cá, Ciência de Dados ganhou uma certa fama. Criou-se uma aura charmosa em torno do termo Big Data. Mas há muito tempo se faz mineração de dados, que evoluiu para mineração de textos (tirando proveito da enxurrada de dados não-estruturados que se tornou disponível com o advento da web).
É bem verdade que os métodos vêm sendo melhorados, criando-se uma certa didática (calma que você vai entender porque estou usando essa palavra) para emprego encadeado das diversas técnicas e muito disso se deve àquele pessoal “old school” mesmo, que testou muita coisa para descobrir o que efetivamente funcionava para determinado fim.
E justamente neste ponto, insiro uma observação pessoal baseada na minha experiência: qualquer tarefa de ciência de dados deve ter em vista um objetivo final a ser alcançado. Não existe essa coisa de “deixa eu analisar esses dados aí” sem saber exatamente o que se busca com isso. Pois não existe método que se aplique a qualquer objetivo e tampouco um objetivo que se alcance com um método específico selecionado a priori (salvo para situações já manjadas). Porque tudo é dirigido pelos dados e antes da análise propriamente dita vão-se algumas fases destinadas a preparar os dados para a análise, o que tende a ser intensivo o suficiente para modificar qualquer estratégia previamente concebida.
Pois bem, para não fugir do tema e tirar zero na redação, retorno ao lance da “modinha”, agora respaldado pelo cenário apresentado para dizer que, graças a essa velha guarda dos tempos de KDD e todos os "minings da vida", explodiu a quantidade de cursos online sobre Ciência de Dados e com muito brilhantismo David Venturi descreveu um pouco da sua própria experiência de aprendizado no tema, realizando uma extensa pesquisa sobre esses cursos, que pode ser acessada em “I ranked every Intro to Data Science course on the internet, based on thousands of data points”.
Vale muito a lida!
PhD in Ocean Engineering (Remote Sensing)@Brazilian Navy, MEng in Computer Engineering (Geomatics), Cartographic Engineer
6 aValeu!!!
PhD in Ocean Engineering (Remote Sensing)@Brazilian Navy, MEng in Computer Engineering (Geomatics), Cartographic Engineer
6 aFala Gomes. Será que já existe no mercado empresa para mapear os processos de uma organização objetivando a gestão de conhecimento? Sendo mais específico, empregando um mix de data mining, ontologias e RNA? Tal ferramenta seria útil na geração de relatórios, produção de subsídios, tanto na parte técnica quanto burocrática, além de minimizar os impactos da perda constante de pessoal dentro das OM. As certificações ISO permitem um cobre e alinha, mas não propiciam, necessariamente, uma automatização desses controles. Em suma, permitir ao time de engenharia investir mais tempo em pesquisa e menos em paperwork. Abraços.