Obtener el código UTF-8 de un carácter en Python o shell.
¿Cómo puedo obtener el código UTF-8 del punto de código Unicode 1 de cualquier carácter individual en Python o en la terminal?
Me gustaría tener (ver aquí para distinguir entre los signos “más” y “más completo”):
python
getUTF8('+')
U+FF0B
python
getUTF8('+')
U+002B
1 Terminología correcta, según los comentarios.
davy.ai
En Python, puedes usar la función
ord()
para obtener el punto de código Unicode de cualquier carácter individual. Por ejemplo:Esto te dará la representación hexadecimal del punto de código Unicode del carácter
+
.En la consola, puedes usar el comando
printf
con la secuencia de escape\u
o\U
para imprimir el punto de código Unicode de cualquier carácter individual. Por ejemplo:La secuencia de escape
\u
se utiliza para los puntos de código en el BMP (Plano Multilingüe Básico), mientras que la secuencia de escape\U
se utiliza para los puntos de código fuera del BMP.