Tag: DPLYR
Tengo 50 archivos (cada uno con entre 1 y 2 millones de filas) todos con una columna variant_id en la que quiero hacer cambios; los archivos tienen un diseño como este: variant_id … chr1_665098_G_A_b38 … chr2_665097_C_T_b38 … chr3_665094_A_GG_b38 … chr10_23458_TTTCAAG_C_b38 … Quiero editar la columna variant_id para que quede así: . . . Read more
Tengo un conjunto de datos df que se ha dividido en int1 e int2. En int1 e int2, hay dos elementos para IDA y tres elementos para IDB. Mi objetivo es crear una matriz de 2×2 para IDA y 3×3 para IDB, y que se divida de mi lista de . . . Read more
Necesito calcular el número de días que cada persona en un conjunto de datos pasa en un trimestre fiscal. Aquí hay un marco de datos con 4 personas hipotéticas: id <- c(‘1’, ‘2’, ‘3’, ‘4’) enddate <- c(“2009-05-24”, “2002-02-04”, “2015-09-23”, “2011-12-04”) startdate <- c(“2004-07-24”, “1992-07-04”, “2011-03-23”, “2001-07-04”) df <- data.frame(id, . . . Read more
Tengo un conjunto de datos similar al siguiente: id fecha evento 1 01/02/2016 paracetamol 1 02/03/2016 paracetamol 1 16/04/2015 ibuprofeno 2 01/03/2018 paracetamol 2 10/03/2018 codeína 2 15/02/2019 codeína 2 22/02/2019 codeína Y quiero: 1) crear dos columnas que contengan la primera y la última instancia de cada evento y . . . Read more
Estoy trabajando en un dataframe que consiste en 528 columnas y 2.643.246 filas. Ocho de estas son variables de caracteres, y el resto son enteros. En total, esto suma hasta 11.35 GiB de datos, con mi RAM disponible siendo de 164 GiB. Ahora quiero ejecutar un pivot_longer en dicho dataframe, . . . Read more