Tag: BIOPYTHON
Tengo un archivo de alineación de secuencias múltiples como el siguiente: JF735120.1<em>1-200 TCTTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGTACAGCCTCCAGGCC NC</em>009823.1<em>1-200 TCTTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGTACAGCCTCCAGGCC KM349851.1</em>1-200 TCTTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGTACAGCCTCCAGGCC JF735122.1<em>1-200 TCTTCACGCGGAAAGCGTCTAGCCATGGCGTTAGTACGAGTGTCGTGCAGCCTCCAGGCC AF177036.1</em>1-200 –TTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGTACAGCCTCCAGGAC <strong><em>*</em></strong> <strong><em>*</em></strong> <strong><em>*</em><em>*</em><em>*</em><em>*</em><em>*</em></strong> <strong><em>*</em><em></em></strong> <strong><em>*</em><em>*</em></strong> * ¿Cómo puedo iterar sobre el archivo usando Python para encontrar el símbolo de asterisco y imprimir solo la línea anterior en la misma . . . Read more
Estoy trabajando con secuencias de aminoácidos utilizando el analizador Biopython, pero independientemente del formato de datos (el formato es fasta, es decir, puedes imaginarlos como cadenas de letras precedidas por el id), mi problema es que tengo una gran cantidad de datos y a pesar de haber intentado paralelizarlo con . . . Read more
El código que se muestra a continuación es del tutorial de Biopython. Mi intención es agregar ‘N5‘ después de cada contig. ¿Por qué no está presente el N10 que sigue al tercer contig “TTGCA”? from Bio.Seq import Seq contigs = [Seq("ATG"), Seq("ATCCCG"), Seq("TTGCA")] spacer = Seq("N"*10) spacer.join(contigs) output Seq('ATGNNNNNNNNNNATCCCGNNNNNNNNNNTTGCA') expected . . . Read more
Tengo el siguiente error: Bio.Application.ApplicationError: Código de retorno distinto de cero (2) desde ‘psiblast -out 7NDB_B_WT.out -query 7NDB_B_WT.fasta -db /mnt/research/common-data/Bio/blastdb/nr -evalue 5000 -num_iterations 3 -out_ascii_pssm 7NDB_B_WT.pssm’, mensaje ‘Error de la base de datos BLAST: No se encontró ningún archivo de alias o índice para la base de datos de proteínas . . . Read more
Esperaba que alguien pudiera ayudarme. Estoy tratando de crear una función que, dada una secuencia de ADN (in)ambigua y un intervalo de peso molecular, devuelva una lista de todas las secuencias no ambiguas representadas por la secuencia dada. Hasta ahora he llegado a esto: import re import sre_yield from Bio . . . Read more