Cómo agregar columnas con variables de cadena en awk.

davy.ai

July 25, 2023 at 6:45 pm

Para generar un nuevo archivo txt a partir de un grupo de archivos txt de entrada, seleccionando columnas específicas y agregando nuevas columnas con variables de cadena definidas, se puede utilizar un bucle for con el comando awk.

Supongamos que tenemos un archivo de entrada llamado “E2_NCAPG_r1_UCSC_DNA_exon_fraction_counts.txt” del cual queremos crear el archivo de salida con el siguiente contenido:

AluJb   165824  E2  DNA exon
AluSp   43328   E2  DNA exon
AluSc5  5753    E2  DNA exon

Para lograr esto, podemos utilizar el siguiente bucle for con el comando awk:

for file in E2*.txt; do
    awk 'BEGIN{OFS="\t"} {print $1, $4, "E2", "DNA", "exon"}' "$file" > "${file}_new.txt"
done

En este bucle, iteramos sobre todos los archivos txt que comienzan con “E2” en sus nombres. Para cada archivo, usamos el comando awk para seleccionar las primera y cuarta columnas, y agregamos tres nuevas columnas con las variables de cadena “E2”, “DNA” y “exon”. El resultado se redirige a un nuevo archivo txt con el nombre del archivo de entrada seguido de “_new.txt”.

Nota que utilizamos OFS="\t" para establecer el separador de campo de salida como una tabulación, de modo que las columnas estén correctamente alineadas en el archivo de salida. Además, encerramos la variable $file entre comillas dobles para manejar nombres de archivo con espacios o caracteres especiales.

Answer

davy.ai

July 25, 2023 at 6:45 pm
Para generar un nuevo archivo txt a partir de un grupo de archivos txt de entrada, seleccionando columnas específicas y agregando nuevas columnas con variables de cadena definidas, se puede utilizar un bucle for con el comando awk.

Supongamos que tenemos un archivo de entrada llamado “E2_NCAPG_r1_UCSC_DNA_exon_fraction_counts.txt” del cual queremos crear el archivo de salida con el siguiente contenido:
```
AluJb   165824  E2  DNA exon
AluSp   43328   E2  DNA exon
AluSc5  5753    E2  DNA exon
```
Para lograr esto, podemos utilizar el siguiente bucle for con el comando awk:
```
for file in E2*.txt; do
    awk 'BEGIN{OFS="\t"} {print $1, $4, "E2", "DNA", "exon"}' "$file" > "${file}_new.txt"
done
```
En este bucle, iteramos sobre todos los archivos txt que comienzan con “E2” en sus nombres. Para cada archivo, usamos el comando awk para seleccionar las primera y cuarta columnas, y agregamos tres nuevas columnas con las variables de cadena “E2”, “DNA” y “exon”. El resultado se redirige a un nuevo archivo txt con el nombre del archivo de entrada seguido de “_new.txt”.

Nota que utilizamos OFS="\t" para establecer el separador de campo de salida como una tabulación, de modo que las columnas estén correctamente alineadas en el archivo de salida. Además, encerramos la variable $file entre comillas dobles para manejar nombres de archivo con espacios o caracteres especiales.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Cómo agregar columnas con variables de cadena en awk.

Answer

davy.ai