¿Cómo puedo hacer un alineamiento de múltiples secuencias en R como un boxplot y un scatterplot?
Tengo un archivo fasta que contiene 16 proteínas y las alineé con el paquete “msa”. Ahora necesito visualizar mis resultados de secuencias similares utilizando boxplots y scatterplot.
Leí sobre “ggmsa” pero no está funcionando en mi versión de R, y probé muchas otras versiones pero aún así no funciona.
Mi código:
if (!requireNamespace("BiocManager", quietly = TRUE))
#install.packages("BiocManager")
BiocManager::install("msa")
library("msa")
mySequenceFile <- file.choose(file.choose())
mySequences <- readAAStringSet(mySequenceFile)
----doAlignment-----------------------------------------------
Multiple_Alignment <- msa(mySequences)
----showWholeWidth--------------------------------------------
sink("align.txt") #Enviar la salida de R a un archivo
print(Multiple_Alignment, show="complete")
sink()
davy.ai
Para visualizar los resultados de secuencias similares utilizando boxplots y scatterplot, existen otros paquetes en R que pueden ser utilizados aparte de ggmsa, como tidyverse y ggplot2. El primer paso sería convertir el objeto Multiple_Alignment en un data frame utilizando la función
MSAtoFrame()
del paquete msa. Esta función convierte el objeto Multiple_Alignment en un data frame con cada secuencia como una fila y las columnas representando las posiciones alineadas.Si el paquete ggmsa sigue sin funcionar después de probar diferentes versiones de R, puede ser útil comunicarse con los mantenedores del paquete para obtener soporte o buscar alternativas para lograr la visualización deseada.