Eliminador de caracteres invisibles

Detecta y elimina caracteres Unicode invisibles: espacio de ancho cero, guión suave y más

¿Qué es y cómo funciona?

Los caracteres invisibles son puntos de código Unicode que no ocupan espacio visible pero pueden causar problemas significativos en el procesamiento de texto, bases de datos, APIs e interfaces de usuario. Los más comunes: Espacio de Ancho Cero (U+200B), Espacio de Ancho Cero Sin Ruptura (U+FEFF, el BOM), Unificador de Ancho Cero (U+200D), y marcas de dirección.

Esta herramienta detecta y elimina caracteres invisibles del texto, resaltando exactamente dónde ocurren y qué punto de código Unicode es cada uno. Las fuentes comunes incluyen: copiar texto de PDFs, pegar desde documentos Word, o copiar desde sitios web que usan espacios de ancho cero para el kerning de fuentes.

Casos de uso

Preguntas frecuentes

¿Qué es el BOM (Marca de Orden de Bytes) Unicode y es siempre seguro eliminarlo?

El BOM (U+FEFF) al inicio de un archivo UTF-8 es técnicamente un carácter invisible. En UTF-8, el BOM es innecesario y causa problemas. Puedes eliminar BOM de texto UTF-8 y archivos HTML UTF-8 de forma segura.

¿Para qué se usan legítimamente los Unificadores de Ancho Cero?

El Unificador de Ancho Cero (U+200D) se usa legítimamente en secuencias de emoji: 👨‍👩‍👧‍👦 es en realidad cuatro emoji separados unidos por U+200D. Eliminar ZWJ de secuencias de emoji las divide en sus emoji componentes.

¿Por qué aparecen espacios de ancho cero en texto de sitios web?

El Espacio de Ancho Cero (U+200B) se usa en tipografía web como "oportunidad de ajuste suave" — un punto donde el navegador puede dividir una palabra larga entre líneas. Son visualmente invisibles pero rompen la coincidencia de cadenas.

¿Cómo puedo detectar caracteres invisibles programáticamente?

Regex: `/[\u200B-\u200D\uFEFF\u00AD\u200E\u200F]/g` cubre los más comunes. En Python: `import unicodedata; unicodedata.category(c)` para identificar categorías Cf, Cc y Zs.

Texto

Mayúsculas / Minúsculas · Contador de palabras · Contador de caracteres · Generador Lorem Ipsum · Eliminar espacios extra · Ordenar líneas de texto