Herramientas VT Decompose

Información de posición	mediana DP
3 CHR3 POS1 A G	1,1,2
3 CHR3 POS1 A C	1,1,2
3 CHR3 POS1 A T	1,1,2
5 CHR3 POS2 C AT	10,19,4,2.5,25
5 CHR3 POS2 C T	10,19,4,2.5,25
5 CHR3 POS2 C AGT	10,19,4,2.5,25
5 CHR3 POS2 C CG	10,19,4,2.5,25
5 CHR3 POS2 C G	10,19,4,2.5,25

Información de posición	mediana DP
3 CHR3 POS1 A G	1
3 CHR3 POS1 A C	1
3 CHR3 POS1 A T	2
5 CHR3 POS2 C AT	10
5 CHR3 POS2 C T	19
5 CHR3 POS2 C AGT	4
5 CHR3 POS2 C CG	2.5
5 CHR3 POS2 C G	25

davy.ai

May 30, 2023 at 6:03 pm

Para extraer el número correspondiente de la sexta columna, puedes dividir los valores de la columna “mediana DP” usando la ‘,’ (coma) como delimitador y tomar el número basado en la posición del alelo alternativo (el alelo ref siempre es el primer alelo y el alelo alt es el segundo en tus datos). Así es como puedes hacerlo usando Python:

import pandas as pd

# lee la tabla en un DataFrame de pandas
df = pd.read_table("input.txt")

# divide los valores de la columna "mediana DP" y extrae el valor para el alelo alternativo
ref_alt = df["Ref"] + "," + df["Alt"]
alt_idx = [x.split(',').index(y) + 1 for x, y in zip(df["Median_DP"], ref_alt)]
alt_dp = [x.split(',')[i-1] for x, i in zip(df["Median_DP"], alt_idx)]

# crea un nuevo DataFrame con las columnas requeridas
new_df = pd.DataFrame()
new_df["Información de la posición"] = df["Chr"].astype(str) + " " + df["Start_Pos"].astype(str) + " " \
                          + df["Ref"] + " " + df["Alt"]
new_df["mediana DP"] = alt_dp

# escribe la nueva tabla en un archivo
new_df.to_csv("output.txt", sep="\t", index=False)

Explicación:

Primero, la tabla de entrada se lee en un DataFrame de pandas, asumiendo que es un archivo de texto separado por tabulaciones.
A continuación, se construye una cadena que combina los alelos ref y alt para cada fila, que se utilizará para extraer la cobertura de profundidad mediana específica del alelo correspondiente.
Luego, se recorre cada valor separado por comas en la columna “mediana DP” y se extrae el valor de cobertura de profundidad según el índice del alelo alternativo, que se obtiene dividiendo la cadena ref/alt y encontrando la posición del alelo alt en esta lista.
Finalmente, se crea un nuevo DataFrame que contiene las columnas requeridas y se escribe en un archivo de texto separado por tabulaciones utilizando el método to_csv().

Answer

davy.ai

May 30, 2023 at 6:03 pm
Para extraer el número correspondiente de la sexta columna, puedes dividir los valores de la columna “mediana DP” usando la ‘,’ (coma) como delimitador y tomar el número basado en la posición del alelo alternativo (el alelo ref siempre es el primer alelo y el alelo alt es el segundo en tus datos). Así es como puedes hacerlo usando Python:
```
import pandas as pd

# lee la tabla en un DataFrame de pandas
df = pd.read_table("input.txt")

# divide los valores de la columna "mediana DP" y extrae el valor para el alelo alternativo
ref_alt = df["Ref"] + "," + df["Alt"]
alt_idx = [x.split(',').index(y) + 1 for x, y in zip(df["Median_DP"], ref_alt)]
alt_dp = [x.split(',')[i-1] for x, i in zip(df["Median_DP"], alt_idx)]

# crea un nuevo DataFrame con las columnas requeridas
new_df = pd.DataFrame()
new_df["Información de la posición"] = df["Chr"].astype(str) + " " + df["Start_Pos"].astype(str) + " " \
                          + df["Ref"] + " " + df["Alt"]
new_df["mediana DP"] = alt_dp

# escribe la nueva tabla en un archivo
new_df.to_csv("output.txt", sep="\t", index=False)
```
Explicación:
- Primero, la tabla de entrada se lee en un DataFrame de pandas, asumiendo que es un archivo de texto separado por tabulaciones.
- A continuación, se construye una cadena que combina los alelos ref y alt para cada fila, que se utilizará para extraer la cobertura de profundidad mediana específica del alelo correspondiente.
- Luego, se recorre cada valor separado por comas en la columna “mediana DP” y se extrae el valor de cobertura de profundidad según el índice del alelo alternativo, que se obtiene dividiendo la cadena ref/alt y encontrando la posición del alelo alt en esta lista.
- Finalmente, se crea un nuevo DataFrame que contiene las columnas requeridas y se escribe en un archivo de texto separado por tabulaciones utilizando el método to_csv().

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Herramientas VT Decompose – Mediana DP

Answer

davy.ai