Transfer Learning: O que é aprendizado por transferência

O Transfer Learning, aprendizado por transferência em português, é uma abordagem em que um modelo pré-treinado é utilizado para uma nova tarefa relacionada. Esse método economiza tempo e recursos, além de melhorar o desempenho dos modelos de Machine Learning. Existem diferentes estratégias para ajustar modelos pré-treinados a uma nova tarefa.

O que é Transfer Learning?

Transfer Learning é uma técnica do campo do aprendizado de máquina, onde um modelo treinado é otimizado para uma nova tarefa similar. Em vez de treinar um novo modelo do zero para uma tarefa específica, aproveita-se o conhecimento já adquirido. Com ajustes mínimos, o modelo pré-treinado é adaptado às novas características e pode ser utilizado em outra tarefa. O uso de um modelo existente economiza tempo e recursos, pois a quantidade de dados necessária para o treinamento é muito menor. Esse método é, portanto, mais eficiente e eficaz.

Como funciona o Transfer Learning?

No aprendizado por transferência, um modelo que já foi completamente treinado para uma tarefa específica é aplicado a uma nova tarefa semelhante. Isso funciona especialmente bem com dados não estruturados, como imagens ou vídeos. Por exemplo, um modelo treinado para reconhecer imagens de carros pode ser usado para identificar caminhões, aproveitando características comuns entre os dois grupos, como rodas, portas e a forma geral.

Seleção do modelo treinado

Como ponto de partida, você precisa de um modelo treinado. Este modelo é treinado com um grande conjunto de dados e exemplos marcados. Ele aprende padrões e relações nos dados, permitindo que execute a tarefa proposta. No campo do Machine Learning, falamos em camadas interligadas através das quais os cálculos podem ser feitos. Quanto mais camadas um modelo tem, mais complexos os padrões que ele pode detectar.

No Transfer Learning, você escolhe um modelo que já passou por essas etapas com sucesso. Vale a pena observar de perto a tarefa de origem do modelo existente. Quanto mais próxima ela for da nova tarefa, mais fácil será a adaptação.

Reconfiguração e treinamento do modelo

No segundo passo, você configura o modelo pré-treinado para a nova tarefa. Existem duas abordagens principais para isso, e você pode escolher a que melhor se adequa ao seu caso.

Na primeira abordagem, a última camada do modelo de origem treinado é substituída. Essa camada é chamada de Output Layer (camada de saída). Ela faz a classificação final, ou seja, determina se um arquivo atende aos parâmetros definidos ou não. No nosso exemplo, isso significaria que a camada decide se a imagem apresentada é de um carro. Em muitos casos, você pode remover essa camada e substituí-la por uma nova, adaptada ao seu objetivo. No nosso exemplo, ela passaria a identificar caminhões.

Alternativamente, no aprendizado por transferência, é possível congelar os parâmetros existentes e, em vez disso, adicionar novas camadas. Essas camadas são precisamente ajustadas para a nova tarefa e integradas ao modelo. Depois disso, o modelo ajustado é treinado com um conjunto de dados muito menor, que contém os exemplos relevantes. O modelo reconhece padrões e relações, utilizando os conhecimentos já adquiridos durante o treinamento anterior.

Verificação do progresso

A última etapa deve ser realizada em todos os casos: apenas por meio de monitoramento cuidadoso e ajustes, quando necessário, no material de treinamento e possivelmente nas novas camadas, você conseguirá treinar a inteligência artificial para a nova tarefa. Se os parâmetros forem ajustados durante o treinamento, isso aumentará a precisão da previsão, e o modelo aprenderá a cumprir os novos requisitos.

Quais são as estratégias de Transfer Learning?

Existem diversas estratégias para o uso de Transfer Learning. A escolha da abordagem adequada depende principalmente do objetivo da aplicação. Aqui estão algumas das abordagens:

  • Extração de características: Nesta abordagem, você usa o modelo treinado anteriormente como um fator fixo para características básicas, como texturas. As novas camadas são usadas para reconhecer características específicas. Essa aplicação é útil quando as fontes e os destinos possuem grande sobreposição.
  • Aprendizado por transferência indutiva: Neste caso, os dados de origem e destino são idênticos, mas as tarefas associadas a eles são diferentes. Assim, novas funcionalidades podem ser treinadas mais rapidamente.
  • Aprendizado por transferência transdutiva: Nesta estratégia, o conhecimento adquirido na tarefa de origem é transferido diretamente para casos específicos da nova tarefa, ajudando na classificação, por exemplo. Esse método é promissor quando as tarefas de origem e destino têm poucas semelhanças.
  • Aprendizado por transferência não supervisionada: Aqui, as fontes e os destinos são semelhantes, mas as tarefas são diferentes. Além disso, os dados não são rotulados. O modelo aprende as diferenças e semelhanças dos dados não rotulados e consegue generalizá-los.
  • Multitarefa: Neste modelo, uma única rede realiza várias tarefas ao mesmo tempo, que não são idênticas, mas têm uma conexão entre si. Isso permite o compartilhamento de conhecimentos.
  • Previsão: Nesta forma de Transfer Learning, o modelo deve preencher aspectos faltantes dos dados por conta própria. Por exemplo, palavras em uma sentença podem ser previstas. O ajuste fino do modelo pode melhorar os resultados.
  • Zero-Shot e Few-Shot: Esta abordagem é usada no campo da IA generativa, quando o conhecimento de uma fonte precisa ser transferido para um objetivo, com poucas (Few-Shot) ou nenhuma (Zero-Shot) semelhança entre as duas tarefas. Essa técnica é aplicada quando há poucos dados de treinamento disponíveis.
  • Desagregação: Neste método, os dados são divididos em diferentes fatores. O modelo pode, então, analisar e manipular, por exemplo, o estilo e o conteúdo de forma separada.

Quais são as áreas de aplicação do Transfer Learning?

Existem inúmeras áreas em que o aprendizado por transferência pode ser aplicado. O método economiza significativamente em termos de custos, tempo e recursos, trazendo assim uma série de vantagens. Até o momento, os principais campos de aplicação incluem:

  • Reconhecimento de imagens
  • Reconhecimento de fala
  • Localização de objetos
  • Diagnóstico na saúde

No futuro, o Transfer Learning provavelmente será utilizado em muitas outras áreas.

Este artigo foi útil?
Para melhorar a sua experiência, este site usa cookies. Ao acessar o nosso site, você concorda com nosso uso de cookies. Mais informações
Page top