A melhor definição de Machine Learning ainda é esta

A melhor definição de Machine Learning ainda é esta

Quando comecei meus estudos em Data Science e Inteligência Artificial há alguns anos, li diversos livros e artigos científicos que procuravam explicar como alguns algoritmos de Machine Learning funcionavam.

Ainda que não fosse complicado entender as particularidades de cada algoritmo, faltava compreender qual era o propósito geral de Machine Learning e como ele deveria funcionar. Só assim eu saberia que os algoritmos estão trabalhando da maneira que eu esperava...

Apesar de cada classe de algoritmos trabalhar de uma forma completamente diferente de outra classe, era certo que deveria existir uma definição que tornasse compreensível a aplicação de qualquer técnica de Machine Learning.

Por exemplo, enquanto um algoritmo que constrói árvores de decisão tenta resolver um problema de busca, uma técnica de aprendizado probabilístico utilizará o teorema de Bayes. Na primeira técnica, o algoritmo buscará uma ou mais soluções em um conjunto finito de possíveis soluções. Na segunda, não existe busca, mas um cálculo sobre as probabilidades de cada uma das soluções serem ou não verdadeiras.

Essas diferentes abordagens conduzem a um mesmo resultado experimental. Se o seu objetivo é cortar uma laranja ao meio, aqui você poderá utilizar tanto uma faca quanto um machado, pois ambos os instrumentos atingirão esse resultado, ainda que com desempenhos diferentes.

Para que você entenda como os experimentos de Machine Learning funcionam, tire o foco das técnicas e volte-se para as definições e os conceitos que são empregados na área.

Muitos livros e artigos falam o que é Machine Learning e ensinam como os algoritmos aprendem. No entanto, nem todas as definições são tão claras ou esclarecem o propósito geral dos algoritmos. Além disso, quase todas as boas definições baseiam-se em apenas uma.

E a melhor definição de Machine Learning ainda é esta:

Considere um programa de computador que aprende a partir da experiência E em relação a alguma classe de tarefas T e medida de desempenho P se o seu desempenho nas tarefas T, medido por P, melhora com a experiência E.

Esse é o famoso conceito do professor Tom Mitchell, definido em 1997 no livro Machine Learning. Além de essa definição ser clássica dentro da área de Data Science, acredito que ela é a melhor forma de entender (e explicar!) como os algoritmos aprendem.

Na prática, esse conceito do professor Mitchell funciona assim:

Imagine que você deseja desenvolver um software que identifique automaticamente os e-mails de spam que você recebe.

Para fazer isso você vai coletar alguns textos de e-mail do que é spam e do que não é spam. Esses textos de e-mail serão a sua experiência E, porque, à medida que o seu software for conhecendo os diferentes e-mails (spam e não-spam), ele vai "aprender" a separar o que é spam do que é não-spam.

A tarefa T é o problema que você está tentando resolver, ou seja, é a tarefa de classificar os e-mails em spam e não-spam.

Já a medida de desempenho P pode ser alguma métrica que informe quanto o seu sistema está acertando essa classificação. Por exemplo, você pode adotar a % de e-mails corretamente classificados pelo software. O importante aqui é saber se o classificador reage aos dados de textos de e-mail que lhe foram apresentados.

Não parece tão complicado, não é mesmo?

Publicado originalmente em orlandojunior.dev.

***

Orlando Silva Junior é um militante apaixonado por soluções computacionais mais inteligentes. Trabalha como cientista de dados no maior banco privado da América Latina, professor de graduação em uma das faculdades mais tradicionais de SP e professor de pós-graduação em um curso de especialização em Ciência de Dados.

Publico diariamente notícias e informações sobre mercado e carreira em Inteligência Artificial. Mantenho contato com uma rede de profissionais interessados em Ciência de Dados. Para saber mais:

Sensacional.

Like
Reply

Parabéns pelo texto cara, rápido e pratico! vou compartilhar conhecimento a partir deste, obrigado.

Luiz Scarp

Co-Founder of Physa | Creating value from data and analytics

6y

Um dia desses um amigo estava questionando se a aplicação de uma regressão linear simples, técnica estatística clássica, deveria mesmo ser classificada como "machine learning". Pela definição do Tom Mitchell, parece não haver dúvidas de que se trata sim de "machine learning", certo?

David Braga

Practice Lead Data Services | Data Strategies Specialist | Big Data - IoT - IA Research

6y

Muito bom artigo, simples e sucinto!! Creio que essa abordagem explicativa funciona grandemente para embasar o entendimento do negócio sobre esses assuntos a abordagens, com isso eles podem vislumbrar cases em seus cenários de trabalho. Parabéns Orlando!!

Alexandre Mundim

Data Science Manager @ MRV | Data & AI | Machine Learning | Optimization | MSc in ML

6y

Fiz um post esses dias a respeito de um livro que toca nesses pontos. Machine Learning é um assunto amplo e complexo e defini-lo em poucas frases é desafiador. A melhor definição de Machine Learning ainda é a do Tom e acredito que ela será por um bom tempo.

To view or add a comment, sign in

More articles by Orlando Junior

Others also viewed

Explore topics