R string: Como criar e usar strings em R

Strings são estruturas de dados essenciais da programação. Elas são usadas para exibir sequências de caracteres e letras individualmente, ou seja, dados textuais. Ao contrário de outras, a linguagem de programação R não possui um tipo de dado chamado “string” — na verdade, esse tipo de dado em R é conhecido como “character”.

O que é string em R?

String é uma estrutura de dado padrão, adotada pelas mais diversas linguagens de programação e que todos os programadores experientes devem saber usar. Se você está em processo de aprender a programar, é de fundamental importância que compreenda o que é uma string, para que possa aplicá-la aos seus códigos.

Em essência, strings são simplesmente sequências de caracteres comumente usadas para armazenar e processar dados não numéricos em códigos. Assim como em outras linguagens, strings devem ser usadas entre aspas simples ou duplas pela programação em R.

Como criar strings em R

É possível criar uma R string com uma única linha de código. Tanto aspas simples quanto aspas duplas podem ser usadas na criação de strings. A escolha fica a critério do desenvolvedor.

string1 <- "Hello world!"
# String with single quotation marks
string2 <- 'Hello world!'
R

Como usar funções e operações em strings em R

A linguagem de programação R oferece aos desenvolvedores um conjunto de funções básicas que tornam a manipulação de dados mais eficiente. Strings, por exemplo, podem ser usadas para realizar diversas operações, tanto nas próprias strings quanto em strings combinadas. Conheça as operações mais importantes que podem ser realizadas em R strings:

  • substr(): Extrai uma porção de uma string
  • paste(): Concatena strings
  • tolower() / toupper(): Converte todas as letras de uma string em minúsculas ou maiúsculas
  • strsplit(): Divide uma string em um ponto específico
  • trimws(): Remove espaços em branco no começo e no final de uma string
  • gsub(): Substitui padrões em uma string com outros caracteres
  • nchar(): Calcula o comprimento de uma string

Se você já trabalha com outras linguagens de programação, provavelmente conhece funções semelhantes às listadas. Por exemplo, strings em Python também podem ser manipuladas por operações equivalentes às acima apresentadas.

substr()

A função substr() extrai substrings de uma string em R. Para fazer isso, insira a string na função como o primeiro parâmetro. Nos segundo e terceiro parâmetros, especifique os índices de início e final da substring que você deseja extrair. Lembre-se de que, ao contrário de outras linguagens de programação, o índice de uma R string começa com 1, e não com 0.

string <- "Hello World"
print(substr(string, start=7, stop=11))
R

O exemplo acima retorna, como resultado, a string World.

paste()

A função paste() é usada na linguagem de programação R para juntar duas ou mais strings — processo conhecido como concatenação. Observe, contudo, que o símbolo + não deve ser usado para concatenar strings. O operador em R + pode ser usado apenas em tipos de dados numéricos.

string <- "Hello"
string2 <- "World"
print(paste(string+ string2))
R

Quando a função paste() é chamada, as cadeias de caracteres string e string2 são concatenadas, o que resulta em: Hello World.

tolower() / toupper()

Com as funções tolower() e toupper(), você pode alterar todas as letras de uma string, tornando-as minúsculas ou maiúsculas. Use, como parâmetro de ambas as funções, a string que você deseja mudar. Ao ser executada, a função apresentará uma nova string com todas as letras minúsculas ou maiúsculas.

string <- "Hello World"
print(tolower(string))
print(toupper(string))
R

O código acima exibirá como resultado hello world e HELLO WORLD. Essas duas funções de strings em R são especialmente úteis para gerenciar dados que devem ser processados diferenciando-se minúsculas e maiúsculas.

strsplit()

A função strsplit(), também aplicável à linguagem de programação R, já é conhecida de desenvolvedores experientes. Por exemplo, a função split() em Python funciona da mesma forma. Quando usada em R, a função strsplit() utiliza strings como parâmetros, para divisões em substrings. O delimitador, por sua vez, definirá em que ponto a string deverá ser quebrada. Quando a função é chamada, ela retorna uma lista com as substrings criadas, mesmo se houver apenas uma.

string <- "Hello World"
print(strsplit(string, " "))
R

O código produz o seguinte resultado:

[[1]]
[1] "Hello" "World"

O resultado acima exibe uma lista com duas strings: "Hello" e "World". No exemplo, o espaço entre as duas palavras foi usado como delimitador.

trimws()

Ao fazer uso da função trimws(), você remove espaços em branco indesejados, tanto no começo quanto no fim de uma string em R. Esse recurso é especialmente útil no processamento de formulários preenchidos por usuários que adicionaram espaços em branco acidentalmente.

string <- "   Hello World   "
print(trimws(string))
R

O código acima exibirá, como resultado, Hello World sem os espaços em branco do começo e do fim da string.

gsub()

A função gsub() desempenha outro tipo de operação em strings em R. Ela adota a substring a ser substituída como primeiro parâmetro. O segundo, por sua vez, será a string que substituirá a definida no primeiro parâmetro. O terceiro especifica em qual string a substituição será aplicada.

string <- "Hello World"
print(gsub("World", "User", string))
R

Em vez de falar oi para o mundo todo, o código acima apresenta um texto endereçado a alguém específico: o usuário (Hello User).

nchar()

Uma das funções mais importantes que podem ser aplicadas a strings em R é nchar(), que informa o comprimento da string em questão.

string <- "Hello World"
print(nchar(string))
R

Em um primeiro momento, o comando em R length() pode ser confuso. No entanto, nessa linguagem de programação, a função length() é usada para determinar o número de elementos em um objeto, e não o número de caracteres na string. Para descobrir o comprimento de uma string em R, use a função nchar().

Dica

Publique os códigos em R programados por você no Webspace da IONOS, que oferece um ano de domínio grátis e espaço suficiente para todos os seus projetos.

Caracteres de controle e sequências de escape

Use caracteres de controle para definir a formatação do texto de uma string em R — caracteres de controle são sequências de escape predefinidas que podem ser usadas para formatar os textos a serem exibidos. Eles permitem, por exemplo, a determinação de quebras de linha e tabulações.

Caracteres especiais, como aspas, que normalmente seriam interpretados como parte da sintaxe de uma string em R, podem ser exibidos por strings usando-se uma sequência de escape. Na programação em R, você deve iniciar sequências de escape com uma contrabarra. Conheça as sequências mais importantes:

  • \n: Nova linha/quebra de linha
  • \t: Tabulador
  • \\: Contrabarra
  • \": Aspas duplas
  • \': Aspas simples
Este artigo foi útil?
Para melhorar a sua experiência, este site usa cookies. Ao acessar o nosso site, você concorda com nosso uso de cookies. Mais informações
Page top