diff --git a/awesome-software/rstudio/README.md b/awesome-software/rstudio/README.md index 10648ba..d8ff379 100644 --- a/awesome-software/rstudio/README.md +++ b/awesome-software/rstudio/README.md @@ -1,8 +1,7 @@ -# Operaciones básicas +# Operaciones en R -### Cargar archivos .xlsx como `dataframes` - -Donde `N_DATASET` es donde se quieren guardar +Cargar archivos como `dataframes`, +donde `N_DATASET` es donde se quieren guardar los datos, y `FILE.xlsx` el archivo en cuestión. Es más recomendable realizar esta importación por la interfaz gráfica que ofrece una previa y @@ -14,8 +13,6 @@ DATASET_N <- read_excel("FILE.xlsx") View(DATASET_N) ``` -### Crear una lista y combinarla - Crea una lista `DATA_LIST` con los `dataframes` importados previamente. Luego, combinar la lista en uno solo. @@ -24,8 +21,6 @@ DATA_LIST <- list(DATASET_01, DATASET_02, ... DATASET_N) DATA_TOT <- Reduce(function(x, y) merge(x, y, all=TRUE), DATA_LIST) ``` -# Operaciones específicas - Para un `dataframe` `DATA_TOT`, añadir una variable (columna) con el valor de una variable `VAR_VALUE`, en caso de ser **mayor** a cero. @@ -40,4 +35,23 @@ con el valor de una variable `VAR_VALUE`, en caso de ser **menor** a cero. DATA_TOT$VAR_NEGATIVE <- ifelse(DATA_TOT$VAR_VALUE < 0, DATA_TOT$VAR_VALUE, 0) ``` -# Operaciones entre filas y columnas +Para un `dataframe` `DATA_TOT`, sumar cada variable `VAR_VALUE` perteneciente +a un grupo encontrado en la variable `VAR_GROUPS`. + +```r +aggregate(DATA_TOT$VAR_VALUE, by=list(Group=DATA_TOT$VAR_GROUPS), FUN=sum) +``` + +Para un `dataframe` `DATA_TOT`, sumar toda la columna `VAR_VALUE`. +El argumento `na.rm = TRUE` elimina las entradas con "NA". + +```r +sum(as.numeric(DATA_TOT$VAR_VALUE), na.rm = TRUE) +``` + +Para un `dataframe` `DATA_TOT`, crear una variable `VAR_SUBSTRING` +con los dígitos desde A hasta B de la variable `VAR_STRING`. + +```r +DATA_TOT$VAR_SUBSTRING <- as.numeric(substr(DATA_TOT$VAR_STRING, A, B)) +```