Tag: CHARACTER-ENCODING
Digamos que me dieron una referencia de caracteres aleatorios como 〹. Necesito una solución para verificar si esto es una codificación válida o no. Creo que puedo usar la librería Charset, pero no puedo entender completamente cómo encontrar una solución.
Estoy tratando de encontrar el esquema de codificación para esta página (y otras) que seguramente están en árabe, utilizando caracteres latinos en el rango ASCII inferior para codificar el contenido. http://www.saintcyrille.com/2011a.htm http://www.saintcyrille.com/2011b.htm (versión en inglés/traducción de esa misma página) He visto varios sitios e incluso documentos PDF con esta codificación, . . . Read more
Tengo un conjunto de datos CSV para un clasificador de ML. Tiene 2 columnas y se ve así: Pero este conjunto de datos está muy sucio, así que decidí abrirlo con Excel, eliminar palabras “sucias” y guardarlo como un nuevo archivo CSV y entrenar mi clasificador de ML en él. . . . Read more
Tengo un archivo que creo que está en formato ISO-8859-8. Sin embargo, tiene tabulaciones en él, lo cual no parece aparecer en este conjunto de caracteres: https://en.wikipedia.org/wiki/ISO/IEC_8859-8 ¿Significa esto que el archivo no está en formato ISO-8859-8 después de todo? ¿Los caracteres codificados en ISO-8859-8 pueden combinarse con tabulaciones?
Frecuentemente me encuentro necesitando crear una lista de caracteres, por ejemplo: xopts:["p", "q", "r", "s", "t", "u", "v", "x", "y", "z"]; y estaba buscando una forma de producir estas listas sin tener que envolver cada carácter en "‘s.