Commands in R: Os principais comandos R
Commands in R, ou comandos R, são a base da análise de dados e da modelagem estatística no ambiente R. Eles fornecem a flexibilidade e as ferramentas necessárias para a leitura de dados, a identificação de padrões e a tomada de decisões bem fundamentadas.
O que são commands in R?
Commands in R são instruções da linguagem de programação R que orientam a execução de determinadas tarefas ou iniciam ações no ambiente R. Eles possibilitam: análise de dados, realização de cálculos estatísticos e criação de visualizações. Insira um command R em uma linha de comando R ou em um script R, para que ele possa ser executado. Entretanto, antes de começar, aprenda a distinguir um comando R de uma função R.
Funções R são blocos de código definidos e nomeados em R, que desempenham tarefas específicas. Elas também podem englobar operadores R e dados R para aceitar argumentos ou retornar valores. Em resumo, funções R são capazes de armazenar, processar e retornar elementos associados a diferentes tipos de dados R.
O Webspace da IONOS disponibiliza a você pelo menos 50 GB de espaço de armazenamento em servidores de alto desempenho e alta disponibilidade. Isso garante que o seu site esteja ininterruptamente on-line, e seja rápido de carregar. Beneficie-se, ainda, de domínio grátis e certificado SSL Wildcard, para manter suas páginas protegidas.
R commands list com os principais commands in R
A lista abaixo, comumente chamada de R commands list, apresenta os comandos R mais utilizados, assim como as respectivas áreas de aplicação na programação R. Escolha e faça uso dos comandos R em destaque, de acordo com as necessidades dos seus projetos.
Manipulação e processamento de dados
-
read.csv()
: Lê dados de um arquivo CSV -
data.frame()
: Cria um framework de dados -
subset()
: Filtra dados de acordo com as condições especificadas -
merge()
: Mescla dados de diferentes data frames -
aggregate()
: Agrega dados com base em critérios especificados -
transform()
: Cria novas variáveis em um data frame -
sort()
: Classifica vetores e data frames -
unique()
: Identifica valores únicos em um vetor ou coluna
Visualização de dados
-
plot()
: Cria gráficos de dispersão e outros tipos de gráficos básicos -
hist()
: Cria histogramas -
barplot()
: Cria gráficos de barras -
boxplot()
: Cria diagramas de caixas -
ggplot2::ggplot()
: Cria visualizações mais sofisticadas e personalizáveis com o pacote ggplot2
Análise estatística
-
summary()
: Gera um resumo dos dados, podendo incluir métricas estatísticas -
lm()
: Desempenha regressões lineares -
t.test()
: Desempenha testes t para testar hipóteses -
cor()
: Calcula coeficientes de correlação entre variáveis -
anova()
: Desempenha análises de variância (ANOVA) -
chi-sq.test()
: Desempenha testes qui-quadrado
Processamento de dados
-
ifelse()
: Desempenha avaliações de condição e expressões condicionais -
apply()
: Aplica uma função a matrizes ou a data frames -
dplyr::filter()
: Filtra dados em data frames com o pacote dplyr -
dplyr::mutate()
: Cria novas variáveis em data frames com o pacote dplyr -
lapply()
,sapply()
,mapply()
: Aplica funções em listas ou vetores
Importação e exportação de dados
-
readRDS()
,saveRDS()
: Lê e salva objetos de dados em R -
write.csv()
,read.table()
: Exporta e importa dados em diferentes formatos
Gráficos e tabelas estatísticas
-
qqnorm()
,qqline()
: Cria diagramas quantil-quantil -
plot()
,acf()
: Exibe diagramas de autocorrelação -
density()
: Exibe funções e histogramas de densidade -
heatmap()
: Cria mapas de calor
Exemplos de commands in R
Os exemplos de códigos que apresentaremos a seguir ensinam como usar comandos R em diferentes situações e para diferentes finalidades. Você pode personalizar e ampliar um command R de acordo com os requisitos dos dados da sua análise.
Ler dados de um arquivo CSV
data <- read.csv("dados.csv")
RO comando read.csv()
é usado para ler dados em R a partir de um arquivo CSV. Ele é útil para importar dados externos no R e disponibilizá-los para análise. No nosso exemplo, os dados importados foram armazenados na variável data
.
Criar gráfico de dispersão
plot(data$X, data$Y, main="Gráfico de dispersão")
RPlot()
é um command R usado para criar gráficos e tabelas em R. A título de exemplo, geramos um gráfico de dispersão que mostra a relação entre as variáveis X
e Y
do data frame data
. O argumento main
define o título do gráfico a ser elaborado.
Desempenhar regressão linear
regression_model <- lm(Y ~ X, data=data)
RNo exemplo acima, desempenhamos uma regressão linear para modelar a relação entre as variáveis X
e Y
do data frame data
. O comando lm()
é usado para calcular uma regressão linear em R. O resultado da regressão é armazenado na variável regression_model
e pode ser usado em outras análises.
Filtrar dados com o pacote dplyr
filtered_data <- dplyr::filter(data, column > 10)
RO comando dplyr::filter()
, derivado do pacote dplyr, é usado para manipular dados — o pacotedplyrdisponibiliza poderosos recursos de filtragem de dados. Obtemos a variável filtered_data
ao selecionarmos as linhas dodata frame data
cujo valor, na coluna, é superior a 10.
Criar diagramas quantil-quantil
qqnorm(data$Variable)
qqline(data$Variable)
RVocê pode usar o comando qqnorm()
para elabora um diagrama quantil-quantil em R. No exemplo acima, instruímos o desenho do diagrama quantil-quantil para a variável Variable
, a partir de data
. O comando qqline()
adiciona uma linha de referência que compara a distribuição em questão com uma distribuição normal.
Se você está apenas começando a aprender sobre a linguagem de programação R, em algum momento se deparará com a mensagem de erro “r command not found”. Outras vezes, você se perguntará o que fazer se um command R não funcionar. Nestes casos, outros de nossos artigos podem lhe ajudar.
Enriqueça seus conhecimentos acessando nosso tutorial sobre programação em R. Nele, você encontrará dicas e informações básicas sobre essa linguagem. Para melhor explorar as possibilidades da programação, outro artigo do nosso Digital Guide dá dicas de como programar.