R melt: Como reestruturar data frames
A conversão de data frames com a função melt()
, na linguagem de programação R, facilita sua adaptação para que atenda a diferentes requisitos. Muitos métodos de análise, como modelos lineares e de variância (ANOVA), favorecem dados em formato long, pois eles são mais naturais e fáceis de interpretar.
Para que serve a função R melt()?
A função R melt()
faz parte do pacote reshape2
. Ela é usada para reestruturar data frames, especialmente em sua conversão do formato wide para long. No formato wide, as variáveis são organizadas em colunas separadas, enquanto o formato long oferece uma melhor exibição para a realização de análises e visualizações.
A função R melt()
é uma ferramenta essencial para transformar dados. Ela é especialmente útil quando as informações só estão disponíveis no formato wide, mas determinadas análises ou gráficos requerem o uso do formato long. Essa opção de reestruturação de dados aumenta a flexibilidade dos data frames e promove o uso otimizado de diversas ferramentas de análise em R e bibliotecas de visualização.
Sintaxe da função R melt()
A função R melt()
pode ser usada com diferentes argumentos.
data.frame
: Refere-se ao data frame que você deseja reestruturar.na.rm
: Um argumento opcional que tem como valor padrãoFALSE
.value.name
: Argumento opcional que possibilita nomear a coluna que contém os valores das variáveis reestruturadas no novo conjunto de dados.id.vars
: Argumento opcional que indica quais colunas devem ser mantidas como identificadores. Neste caso,columns
é usado como placeholder.
Vejamos um exemplo:
O data frame resultante é o seguinte:
Agora, vamos usar a função melt()
e transformar o data frame em formato long:
O data frame reestruturado melted_df
ficaria assim:
O resultado é um data frame que foi reestruturado no formato long. A coluna ID
foi mantida como um identificador, a coluna variável
contém os antigos nomes das colunas (A
e B
) e a coluna Valor
contém os valores correspondentes. Devido à presença de na.rm = FALSE
, faltam alguns valores (sinalizados com NA
).
Remover entradas NA com a função R melt()
É possível remover os valores faltantes nos data frames usando a opção na.rm=True
.
Vamos definir um novo data frame:
O data frame tem a seguinte forma:
Agora, vamos reestruturar o data frame usando a função melt()
:
O novo data frame melted_df
passa a existir em formato long sem os valores NA
:
Se quiser aprender como manipular strings na linguagem R, acesse estes tutoriais sobre as funções R substring() e R paste() do nosso Digital Guide.
Rápido e escalável, confie na hospedagem da IONOS, que inclui domínio grátis no primeiro ano e endereço de e-mail!
- Domínio
- SSL Wildcard
- Suporte 24 horas