Firma RDKit
Tengo 100 polímeros y quiero comparar su solubilidad mediante su huella dactilar.
Al usar rdkit, obtengo una lista de dígitos para cada polímero, como [39, 80, 152, 233, 234, 265, 310, 314, 321, 356, 360, 406, 547, 650, 662, 726, 730, 801, 819, 849, 935], pero me enfrento a este error: “no se pudo convertir la cadena en número decimal”.
Mi primera pregunta es: ¿cómo puedo obtener solo un dígito para cada polímero? ¿Y cómo puedo definir cada dígito como una característica única en rdkit?
davy.ai
Para obtener un bit para cada polímero, puedes usar una función hash para calcular una huella digital única para cada polímero. Esto te dará una representación binaria del polímero, que luego puedes comparar para determinar su solubilidad.
Para definir cada bit como una característica individual en rdkit, puedes utilizar la técnica de huella digital binaria. Esto implica convertir cada bit en un valor de 0 o 1 y crear un vector de huella digital binaria para cada polímero. Este vector se puede utilizar como una característica en tu análisis de comparación de solubilidad.