O que é e como usar a função R predict()?
Com a função predict()
em R, você consegue fazer previsões de dados novos e inéditos, de maneira simples e eficiente. Essa é uma ferramenta de fundamental importância para o aprendizado de máquina (machine learning), sendo amplamente utilizada em análises estatísticas e modelagem preditiva.
Para que usar a função R predict()?
A função R predict()
é uma ferramenta versátil usada em modelos preditivos. Ela gera previsões para pontos de dados novos ou existentes baseadas em modelos estatísticos desenvolvidos anteriormente, como regressão linear, regressão lógica, árvore de decisão e outras técnicas de modelagem. Sua aplicação se estende tanto a análises exploratórias quanto ao desenvolvimento de algoritmos de previsão mais complexos, tornando-se essencial em diversos contextos.
Sintaxe da função predict() em R
A função R predict()
considera como argumentos um modelo treinado e os pontos de dados aos quais a previsão será aplicada. Você também pode especificar opções e parâmetros diferentes baseados no tipo de modelo usado. O resultado é um vetor de previsões útil para diversos fins analíticos, incluindo avaliações de desempenho de modelos, tomadas de decisão ou ilustrações dos dados resultantes.
objeto
: O modelo treinado ao qual as previsões serão aplicadas.dados
: Os pontos de dados para a previsão.intervalo
: Argumento opcional. Serve para inserir o tipo de intervalo de confiança (confidence
para intervalo médio,prediction
para previsões).
Exemplos de aplicação da função R predict()
O exemplo a seguir ilustra como aplicar a função predict()
em R. Usaremos um conjunto de dados definido pelo usuário com valores de velocidade e distância.
Criar e exibir dados
Primeiro, criamos um conjunto de dados definido pelo usuário para avaliar a relação entre velocidade e distância. Usamos a função data.frame()
para criar um data frame e definir os valores das variáveis velocidade
e distância
como c(15, 20, 25, 30, 35)
e c(30, 40, 50, 60, 70)
, respectivamente.
Após criarmos o conjunto de dados, nós o exibimos usando a função print()
. Assim, conseguimos verificar a estrutura e os valores designados ao nosso novo data frame. Veja:
O resultado obtido é:
Criar modelo linear
Resultado:
No exemplo acima você pode observar um modelo linear (modelo_personalizado
) que foi gerado para o conjunto de dados e que ilustra a relação entre velocidade e distância. O resultado do modelo inclui coeficientes e informações estatísticas.
Definir novos valores de velocidade e fazer previsões
Criamos outro conjunto de dados (novos_valores_velocidade
) com novos valores de velocidade. Usamos a função R predict()
para fazer previsões dos valores de distância correspondentes usando o modelo linear criado anteriormente.
Exibir previsões
O resultado exibe os valores de distância previstos com base nos valores de velocidade:
Se quiser aprender a processar strings para manipular textos e limpar dados na linguagem R, confira os nossos tutoriais sobre gsub e sub em R e substrings em R.
Rápido e escalável, confie na hospedagem da IONOS, que inclui domínio grátis no primeiro ano e endereço de e-mail!
- Domínio
- SSL Wildcard
- Suporte 24 horas