guides/awesome-software/rstudio/README.md
2023-11-06 22:27:52 -06:00

1.6 KiB

Operaciones en R

Cargar archivos como dataframes, donde N_DATASET es donde se quieren guardar los datos, y FILE.xlsx el archivo en cuestión. Es más recomendable realizar esta importación por la interfaz gráfica que ofrece una previa y otras opciones útiles.

library(readxl)
DATASET_N <- read_excel("FILE.xlsx")
View(DATASET_N)

Crea una lista DATA_LIST con los dataframes importados previamente. Luego, combinar la lista en uno solo.

DATA_LIST <- list(DATASET_01, DATASET_02, ... DATASET_N)
DATA_TOT <- Reduce(function(x, y) merge(x, y, all=TRUE), DATA_LIST)

Para un dataframe DATA_TOT, añadir una variable (columna) con el valor de una variable VAR_VALUE, en caso de ser mayor a cero.

DATA_TOT$VAR_POSITIVE <- ifelse(DATA_TOT$VAR_VALUE > 0, DATA_TOT$VAR_VALUE, 0)

Para un dataframe DATA_TOT, añadir una variable (columna) con el valor de una variable VAR_VALUE, en caso de ser menor a cero.

DATA_TOT$VAR_NEGATIVE <- ifelse(DATA_TOT$VAR_VALUE < 0, DATA_TOT$VAR_VALUE, 0)

Para un dataframe DATA_TOT, sumar cada variable VAR_VALUE perteneciente a un grupo encontrado en la variable VAR_GROUPS.

aggregate(DATA_TOT$VAR_VALUE, by=list(Group=DATA_TOT$VAR_GROUPS), FUN=sum)

Para un dataframe DATA_TOT, sumar toda la columna VAR_VALUE. El argumento na.rm = TRUE elimina las entradas con "NA".

sum(as.numeric(DATA_TOT$VAR_VALUE), na.rm = TRUE)

Para un dataframe DATA_TOT, crear una variable VAR_SUBSTRING con los dígitos desde A hasta B de la variable VAR_STRING.

DATA_TOT$VAR_SUBSTRING <- as.numeric(substr(DATA_TOT$VAR_STRING, A, B))