7 etapas para o aprendizado de máquina: como se preparar para um futuro automatizado

Imagem: Sdecoret / Shutterstock

A economia cada vez mais digital exige que os conselhos e executivos tenham uma sólida compreensão do cenário digital em rápida mudança. Naturalmente, a inteligência artificial (IA) é uma parte interessada importante. As organizações que desejam se preparar para um futuro automatizado devem ter um entendimento completo da IA. No entanto, AI é um termo abrangente que abrange várias disciplinas, cada uma afetando os negócios de uma maneira ligeiramente diferente.

Quando analisamos a inteligência artificial, ela pode ser dividida em três domínios diferentes:

  1. Robótica, que lida com o mundo físico e pode interagir diretamente com os seres humanos. A robótica pode ser usada para melhorar nosso trabalho de várias maneiras. Incluindo o exoesqueleto da Ford ou os robôs auxiliares da Boston Dynamics.
  2. Sistemas cognitivos, que lidam com o mundo humano. Um ótimo exemplo de um sistema cognitivo como parte da IA ​​são os chatbots. Os chatbots são um exemplo muito tangível em que humanos e máquinas trabalham juntos para alcançar uma meta. Um chatbot é uma interface de comunicação que ajuda indivíduos e organizações a conversar.
  3. Aprendizado de máquina, que lida com o mundo da informação. Máquinas usam dados para aprender, e o aprendizado de máquina visa obter significado desses dados. O aprendizado de máquina usa métodos estatísticos para permitir que as máquinas melhorem com as máquinas. Um subconjunto de aprendizado de máquina é o aprendizado profundo, que permite redes neurais de várias camadas.

A inteligência artificial consiste na integração perfeita de robótica, sistemas cognitivos e aprendizado de máquina.

Figura 1: Inteligência Artificial - adaptado de Goel & Davies, 2019

7 etapas para o aprendizado de máquina

Vamos nos aprofundar um pouco em um desses domínios: aprendizado de máquina. O objetivo do aprendizado de máquina é derivar significado dos dados. Portanto, os dados são a chave para desbloquear o aprendizado de máquina. Existem sete etapas para o aprendizado de máquina, e cada etapa gira em torno dos dados:

Figura 2: 7 etapas do aprendizado de máquina

1. Coleta de dados

O aprendizado de máquina requer muitos dados de treinamento (rotulados, significando aprendizado supervisionado ou não rotulado, significando aprendizado não supervisionado). A coleta de dados ou a especificação de dados também é o primeiro passo no meu novo modelo D2 + A2.

2. Preparação de dados

Dados brutos por si só não são muito úteis. Os dados precisam ser preparados, normalizados, desduplicados e os erros e preconceitos precisam ser removidos. A visualização dos dados pode ser usada para procurar padrões e outliers para verificar se os dados corretos foram coletados ou se estão faltando.

3. Escolhendo um modelo

O terceiro passo consiste em selecionar o modelo certo. Existem muitos modelos que podem ser usados ​​para diversos fins. Ao selecionar o modelo, você precisa garantir que o modelo atenda à meta de negócios. Além disso, você deve saber quanta preparação o modelo exige, quão preciso é e quão escalável é o modelo. Um modelo mais complexo nem sempre constitui um modelo melhor. Os algoritmos de aprendizado de máquina comumente usados ​​incluem regressão linear, regressão logística, árvores de decisão, médias K, análise de componentes principais (PCA), Máquinas de Vetor de Suporte (SVM), Naïve Bayes, Floresta Aleatória e Redes Neurais.

4. Treinamento

Treinar seu modelo é a maior parte do aprendizado de máquina. O objetivo é usar seus dados de treinamento e melhorar de forma incremental as previsões do modelo. Cada ciclo de atualização de pesos e desvios é uma etapa do treinamento. No aprendizado de máquina supervisionado, o modelo é construído usando dados de amostra rotulados, enquanto o aprendizado de máquina não supervisionado tenta extrair inferências de dados não rotulados (sem referências a resultados conhecidos ou rotulados).

5. Avaliação

Após o treinamento, o modelo vem avaliando o modelo. Isso implica testar o aprendizado de máquina em um conjunto de dados de controle não utilizado para ver como ele é executado. Isso pode ser representativo de como o modelo funciona no mundo real, mas isso não precisa ser o caso. Quanto maior o número de variáveis ​​no mundo real, maiores serão os dados de treinamento e teste.

6. Ajuste de parâmetros

Depois de avaliar seu modelo, você deve testar os parâmetros originalmente definidos para melhorar a IA. Aumentar o número de ciclos de treinamento pode levar a resultados mais precisos. No entanto, você deve definir quando um modelo é bom o suficiente, caso contrário, você continuará ajustando o modelo. Este é um processo experimental.

7. Previsão

Depois de concluir o processo de coleta de dados, preparação dos dados, seleção do modelo, treinamento e avaliação do modelo e ajuste dos parâmetros, é hora de responder perguntas usando previsões. Podem ser todos os tipos de previsões, variando de reconhecimento de imagem a semântica e análise preditiva.

Pensamentos finais

O aprendizado de máquina permite que o software se torne preciso na previsão de resultados. Isso aumentará muitos, se não todos, os processos de negócios nos próximos anos. Como tal, o aprendizado de máquina se tornará parte integrante da organização automatizada de amanhã. Graças ao hardware cada vez mais rápido, veremos modelos mais poderosos que oferecem melhores previsões.

Infelizmente, o desafio dos modelos tendenciosos, graças aos dados tendenciosos e aos cientistas tendenciosos, nunca está longe. Portanto, para que as organizações realmente se beneficiem da IA, elas devem garantir que seus modelos e dados sejam isentos de preconceitos, bem treinados, avaliados e ajustados adequadamente. Somente então, as organizações realmente se beneficiarão do aprendizado de máquina.

Se eu consegui manter sua atenção nesse ponto, deixe um comentário descrevendo como essa história fez a diferença para você ou assine meu boletim semanal para receber mais deste conteúdo:

O Dr. Mark van Rijmenam é o fundador da Datafloq, ele é um orador reconhecido globalmente em big data, blockchain e IA, estrategista e autor de três livros de gerenciamento: Think Bigger, Blockchain e The Organization of Tomorrow. Você pode ler uma prévia gratuita do meu último livro aqui. Conecte-se comigo no LinkedIn ou diga oi no Twitter mencionando esta história.

Se você gostaria de falar comigo sobre qualquer trabalho consultivo ou palestras, entre em contato comigo em https://vanrijmenam.nl