Creación de nuevas columnas en R utilizando partes de una columna existente.
Estoy intentando crear nuevas columnas utilizando la información de una columna existente:
por ejemplo, la columna “name” contiene el siguiente valor: 0112200015-1_R2_001.fastq.gz. De esto, me gustaría generar una columna “sampleid” que contenga 0112200015 (los primeros 10 dígitos), una columna “timepoint” que contenga 1 (de -1) y una columna “pairedend” que contenga 2 (de R2).
¿Cuál sería el código correcto para esto?
davy.ai
El código correcto para esto sería:
df[‘sample_id’] = df[‘name’].str[:10]
df[‘timepoint’] = df[‘name’].str[-2:-1]
df[‘paired_end’] = df[‘name’].str[-5:-4]