Trilha machine learning: O que é machine learning?
Vou dar início à trilha de machine learning, onde quero explorar com vocês, diversos algoritmos e suas aplicações, vendo toda sua teoria, mas também a sua prática. E quem quiser contribuir com essa trilha, vem comigo! E para iniciarmos esse caminho, vamos entender primeiro o que é o tão famoso machine learning (aprendizado de máquina, ou ML se preferir).
O aprendizado de máquina é umas das técnicas da ciência de dados e consiste em usar algoritmos e técnicas de matemática e estatística para a partir dos dados que geramos, conseguir entender e realizar sua classificação, ou ainda, prever o seu futuro. Vou simplificar:
Cada interação nossa em algum site, sistema ou até fisicamente em uma loja ou supermercado, gera um rastro de dados sobre nós mesmos, nossas preferências e nossos hábitos, com esses dados, cientistas de dados podem usar algoritmos de machine learning para nos oferecer exatamente o que podemos estar precisando (ou até nos induzir a comprar algo da nossa preferência), sabe aquelas propagandas que estão nos sites e parece que foram feitas pra você? Pois é, elas foram mesmo.
Essa técnica pode ser dividida entre aprendizado de máquina supervisionado, aprendizado não supervisionado e aprendizado por reforço, veja mais abaixo:
No aprendizado supervisionado, fornecemos dados rotulados e separamos em dados para treinamento e teste para que com esses dados nosso algoritmos possa classificar ou prever os resultados, e essa classificação ou previsão são as duas divisões do aprendizado supervisionado, vou exemplificar:
Aprendizado supervisionado - Classificação:
É um método que vai separar/prever um novo valor dentro da sua base, com base naqueles que você já tinha rotulado, por exemplo, você tem uma base com diversas raças de cães e eles são classificados por porte (pequeno, médio e grande), quando inserir um chihuahua na sua base, visto que o algoritmo já aprendeu com os dados anteriormente passados, ele automaticamente irá classificar o chihuahua como um cão de pequeno porte (#FunFacts: O chihuahua é um dos menores cães do mundo!). Exemplo de algoritmo: Árvore de decisão.
Aprendizado supervisionado - Regressão:
É o método que vai prever os dados futuros da sua base com base nos valores anteriores, por exemplo, você tem dados de toda colheita e dados da precipitação dos últimos dois anos, e precisa saber em função do clima como será a sua colheita dos próximos, dias, meses ou ano. Exemplo de algoritmo: Regressão linear.
Agora vamos para o aprendizado não supervisionado, nesse método não vamos inserir dados com valores rotulados, nós vamos usar esse método justamente para extrair o conhecimento da nossa base de dados, ele vai buscar por padrões nos nossos dados, e com eles vai nos dizer o que precisamos saber (ou não). E dentro do aprendizado não supervisionado também temos algumas divisões:
Aprendizado não supervisionado - Agrupamento:
Com base nas similaridades dos dados, o algoritmo irá separar e agrupar os dados em grupos, por exemplo, um e-commerce pode usar os hábitos de compras dos clientes para dividi-los em grupos de consumidores com gostos específicos. Exemplo de algoritmo: K-means.
Aprendizado não supervisionado - Associação:
Esse é o método que enxerga padrões, por exemplo, em uma clínica médica estão armazenando todos os sintomas dos pacientes, e por algum motivo, todos os pacientes que se queixaram de dor de cabeça e dores musculares, tendiam a ter também crises de vômito. Exemplo de técnica de associação: Apriori.
Aprendizado não supervisionado - Redução de dimensão
Ele faz exatamente o que o nome diz, ele reduz a dimensão dos seus dados com base nos atributos similares/ou não similares, para nos trazer o resultado esperado, por exemplo, queremos determinar a qualidade do atendimento de um call center, e temos informações sobre a média de horas de atendimento diária, semanal e mensal, porém para isso não precisamos de todas essas variáveis já que representam a mesma coisa apenas em períodos diferentes, então o algoritmo reduz nossos atributos apenas para um deles.
Por fim, mas não menos importante, o aprendizado por reforço, esses são algoritmos que trabalham com recompensas, se ele dá uma resposta certa recebe a recompensa, se não, ele tenta novamente, e dessa forma gera o aprendizado, um bom exemplo são as aplicações robóticas e alguns jogos. Exemplo de técnica de aprendizado por reforço: SARSA.
Acho que deu pra ter uma noção do básico sobre aprendizado de máquina, mas esse é um campo imenso a ser explorado, e pra cada tema, podemos ter mais infinitos temas relacionados para aprender. Nos próximos artigos pretendo mostrar um pouquinho sobre cada algoritmo, teoria e o mais importante, as aplicações!
Até breve! 😉
Comentários
Postar um comentário