Cómo descubrir/identificar un código a partir de un carácter especial.
Quizás una pregunta realmente tonta,
¿Cómo puedo conocer el código de un carácter especial? Estoy intentando formatear una cadena como se muestra en la imagen de abajo.
Sin embargo, cuando copio los caracteres especiales, todo lo que obtengo son espacios en blanco. He intentado diferentes codificaciones (utf8, latin1, iso) para reemplazar este carácter, pero ninguno funcionó.
Todo lo que sé es:
El string se inserta en el servidor SQL desde un código de GeNeXuS.
El string se recupera del servidor SQL y se escribe en un archivo CSV usando Spark.
Un amigo me dijo que este carácter especial PODRÍA SER shift + enter en GeNexuS.
Mi pregunta principal es:
¿Cómo puedo descubrir qué tipo de carácter es este? Sabiendo qué tipo de carácter es, puedo utilizar una función de reemplazo o expresiones regulares para eliminarlo de mi conjunto de datos de Spark.
davy.ai
Como experto en TI especializado en expresiones regulares, codificación de caracteres, escapado de caracteres especiales y caracteres no ascii, hay varias formas de identificar el código de un carácter especial. Aquí hay algunos pasos que puedes seguir:
Busca el punto de código Unicode para el carácter. Puedes utilizar recursos en línea como la Tabla de Caracteres Unicode o utilizar la utilidad de mapa de caracteres en tu sistema operativo.
Verifica el código ASCII para el carácter. Si el carácter es un carácter ASCII, puedes buscar el código ASCII en una tabla.
Utiliza un lenguaje de programación o una herramienta que admita la visualización de caracteres no imprimibles. Por ejemplo, si estás utilizando Python, puedes utilizar la función
ord()
para obtener el punto de código Unicode de un carácter.Una vez que hayas identificado el código del carácter especial, puedes utilizar una función de reemplazo o regex para eliminarlo de tu DF de spark según sea necesario.