Tag: BIOPYTHON

Análisis de archivos de alineación múltiple de secuencias.

02 Aug, 2023 Programación 0

Tengo un archivo de alineación de secuencias múltiples como el siguiente: JF735120.11-200 TCTTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGTACAGCCTCCAGGCC NC009823.11-200 TCTTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGTACAGCCTCCAGGCC KM349851.11-200 TCTTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGTACAGCCTCCAGGCC JF735122.11-200 TCTTCACGCGGAAAGCGTCTAGCCATGGCGTTAGTACGAGTGTCGTGCAGCCTCCAGGCC AF177036.11-200 –TTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGTACAGCCTCCAGGAC * * ***** * ** * ¿Cómo puedo iterar sobre el archivo usando Python para encontrar el símbolo de asterisco y imprimir solo la línea anterior en la misma . . . Read more

Joblib demasiado lento utilizando el bucle “if not in”.

31 Jul, 2023 Programación 0

Estoy trabajando con secuencias de aminoácidos utilizando el analizador Biopython, pero independientemente del formato de datos (el formato es fasta, es decir, puedes imaginarlos como cadenas de letras precedidas por el id), mi problema es que tengo una gran cantidad de datos y a pesar de haber intentado paralelizarlo con . . . Read more

¿Por qué el método ‘join’ para el objeto Seq en Biopython no funciona en el último elemento de una lista?

24 Jul, 2023 Programación 0

El código que se muestra a continuación es del tutorial de Biopython. Mi intención es agregar ‘N5‘ después de cada contig. ¿Por qué no está presente el N10 que sigue al tercer contig “TTGCA”? from Bio.Seq import Seq contigs = [Seq("ATG"), Seq("ATCCCG"), Seq("TTGCA")] spacer = Seq("N"*10) spacer.join(contigs) output Seq('ATGNNNNNNNNNNATCCCGNNNNNNNNNNTTGCA') expected . . . Read more

Error de la Base de Datos BLAST: No se encontró el archivo de alias o índice para la base de datos de proteínas [/mnt/research/common-data/Bio/blastdb/nr]

23 Jul, 2023 Programación 0

Tengo el siguiente error: Bio.Application.ApplicationError: Código de retorno distinto de cero (2) desde ‘psiblast -out 7NDB_B_WT.out -query 7NDB_B_WT.fasta -db /mnt/research/common-data/Bio/blastdb/nr -evalue 5000 -num_iterations 3 -out_ascii_pssm 7NDB_B_WT.pssm’, mensaje ‘Error de la base de datos BLAST: No se encontró ningún archivo de alias o índice para la base de datos de proteínas . . . Read more

Error de Sobrecarga de Memoria al ejecutar una secuencia larga y ambigua debido a (sre.yield_AllStrings)

21 Jul, 2023 Programación 0

Esperaba que alguien pudiera ayudarme. Estoy tratando de crear una función que, dada una secuencia de ADN (in)ambigua y un intervalo de peso molecular, devuelva una lista de todas las secuencias no ambiguas representadas por la secuencia dada. Hasta ahora he llegado a esto: import re import sre_yield from Bio . . . Read more

1 2 … 4

es.davy.ai

¿Tienes una pregunta?