Formato · Limpieza · Datos

Eliminar Espacios

Limpia el espaciado desordenado de cualquier texto al instante.

Entrada
Salida. Limpio
Espacios eliminados: 0
Caracteres antes: 0
Caracteres después: 0
Publicidad

Sobre la herramienta Eliminar Espacios

Quita los espacios en blanco del texto. Todos los espacios, los espacios múltiples reducidos a uno, solo los espacios iniciales y finales, solo las tabulaciones, solo los saltos de línea, o todos los espacios en blanco incluidos los caracteres invisibles. Seis modos cubren cada caso real de limpieza. Todo se ejecuta localmente en tu navegador; no se sube nada.

Qué puede significar «eliminar espacios»

«Eliminar los espacios de este texto» suena inequívoco hasta que intentas usar una herramienta genérica de quitar espacios con datos reales y la ves producir resultados incorrectos. Hay al menos seis operaciones distintas que se llaman «eliminar espacios», y producen salidas diferentes:

Quitar todos los espacios. Se elimina cada carácter de espacio. "hello world" se vuelve "helloworld". Útil para convertir a un identificador sin espacios, pero destructivo. Pierdes todos los límites entre palabras.

Reducir varios espacios a uno. Las rachas de dos o más espacios se vuelven un solo espacio. "hello   world" se vuelve "hello world". La operación de limpieza más común, ya que copiar y pegar a menudo introduce espacios de más que se ven bien pero estropean las herramientas posteriores.

Recortar solo el inicio y el final. Se quitan los espacios al principio y al final de cada línea; los espacios internos se conservan. Útil para limpiar listas copiadas y pegadas donde cada línea puede tener una sangría no deseada o un espacio final.

Quitar solo las tabulaciones. Se eliminan los caracteres de tabulación (o se reemplazan por un solo espacio). Útil para convertir contenido separado por tabulaciones en separado por espacios, o para normalizar una sangría inconsistente.

Quitar solo los saltos de línea. Se eliminan los caracteres de salto de línea, uniendo todas las líneas en una. Útil para reducir contenido de varias líneas a una sola cadena para pegarlo en campos de formulario que no aceptan entrada de varias líneas.

Quitar todos los espacios en blanco. Se elimina cada carácter de espacio en blanco (espacios, tabulaciones, saltos de línea, tabulaciones verticales, saltos de página, más los espacios en blanco invisibles de Unicode como el espacio de no separación y el espacio de ancho cero). La opción más agresiva; suele ser excesiva pero a veces es necesaria.

Esta herramienta expone los seis como modos separados para que elijas el que se ajusta a la tarea.

Casos de uso reales

Limpiar la salida de OCR. El reconocimiento óptico de caracteres produce texto con espacios de más esporádicos por una segmentación imperfecta de los caracteres. El escaneo de una página impresa a menudo vuelve con espacios dobles, espacios faltantes y tabulaciones finales que se ven bien en unos visores y rotas en otros. Reducir varios espacios es la primera pasada correcta; recortar el inicio y el final es la segunda pasada correcta.

Arreglar URL copiadas y pegadas. Las URL copiadas de un correo o un chat a menudo incluyen un espacio o un espacio de no separación al inicio o al final. Pegadas en la barra del navegador, fallan con errores crípticos. Pásalas por esta herramienta con solo recortar para arreglarlas.

Normalizar direcciones de correo. Los envíos de formularios a veces capturan espacios iniciales o finales en los campos de correo (« example@gmail.com» o «example@gmail.com »). A ojo se ven idénticas a las direcciones limpias, pero fallan la validación contra la mayoría de los regex de correo. Solo recortar el valor del campo atrapa esto.

Limpiar datos de CSV. Las exportaciones de hojas de cálculo a veces contienen espacios finales ocultos en las celdas, sobre todo si los datos de origen vinieron de formularios escritos por personas. Esos espacios sobreviven a la exportación y rompen las comparaciones de cadenas posteriores. Recortar es la limpieza correcta; quitar todos los espacios en blanco es la equivocada (uniría "John Smith" en "JohnSmith").

Comprimir texto para tuits, SMS o cualquier campo con límite de caracteres. Quitar los espacios de más (el modo de reducir) recupera unos pocos caracteres por oración y puede ser la diferencia entre caber y no caber en una ventana de 280 caracteres. A veces se usa el quitado agresivo de espacios para el mismo fin, aunque deja el texto ilegible.

Generar identificadores a partir de cadenas de lenguaje natural. "Hello World" → "HelloWorld" quitando todos los espacios es un paso de preprocesamiento común antes de una conversión de mayúsculas posterior. Combina esta herramienta con el Conversor de Mayúsculas para la generación completa de identificadores.

Preparar texto para campos de contraseña, claves de API o tokens. Muchos sistemas quitan el espacio en blanco inicial y final en silencio; otros no. Pasar la entrada por un recorte de forma preventiva antes de enviarla evita la categoría de tickets de soporte del tipo "pero copié y pegué exactamente el valor correcto".

Caracteres de espacio en blanco ocultos

Más allá del espacio, la tabulación y el salto de línea obvios, el texto del mundo real contiene caracteres invisibles que parecen espacios en blanco pero estropean el quitado ingenuo. El modo «todos los espacios en blanco» de la herramienta los maneja; los modos específicos no.

Espacio de no separación (U+00A0). Parece un espacio, evita el salto de línea. Común en texto derivado de HTML y en la salida de Microsoft Word. El atajo de teclado Option+Espacio en Mac lo produce.

Espacio de ancho cero (U+200B). Invisible. Lo usan algunos CMS para insertar píxeles de seguimiento o para sugerir posiciones de salto de línea. Estropea la deduplicación y las comprobaciones de igualdad.

Espacio em, espacio en, espacio capilar y espacio fino (U+2003, U+2002, U+200A, U+2009). Anchos distintos, todos invisibles en tamaños pequeños. Comunes en texto compuesto tipográficamente de exportaciones de LaTeX o InDesign.

Unión de ancho cero y no unión (U+200D, U+200C). Se usan en algunas escrituras (devanagari, persa) para el control de ligaduras; a veces aparecen en secuencias de emoji copiadas y pegadas.

Marca de orden de bytes (U+FEFF). Un único carácter invisible al inicio de los archivos guardados con ciertas codificaciones. Estropea el primer carácter de las comparaciones de igualdad.

Si trabajas con texto donde «eliminar espacios» no parece quitar lo que ves, cambia al modo de todos los espacios en blanco y vuelve a intentar. Uno de estos caracteres invisibles es probablemente el culpable.

Errores frecuentes

Quitar todos los espacios destruye los límites entre palabras. No uses el modo de todos los espacios con texto de lenguaje natural salvo que tengas un motivo específico. El modo de reducir varios es casi siempre lo que de verdad quieres.

Recortar no arregla el espacio en blanco interno. Si una línea es "hello   world", recortar quita el principio y el final sin nada especial, y deja intactos los tres espacios internos. Probablemente quieres el modo de reducir.

Quitar los saltos de línea convierte los documentos en muros de texto. Útil de vez en cuando para escenarios de pegar en un formulario; casi nunca es lo que quieres para una limpieza general. Confirma antes de aplicarlo.

Quitar espacios de forma agresiva puede corromper el código. El código fuente, JSON y YAML dan significado a los espacios. No los pases por ninguno de estos modos; usa un formateador adecuado (el Formateador de JSON para JSON, herramientas específicas del lenguaje para el código).

Eliminar Espacios vs Buscar y Reemplazar vs regex

Esta herramienta. La más rápida para los seis modos comunes, sin sintaxis de regex que recordar, maneja el espacio en blanco invisible de Unicode en el modo de todos.

Buscar y Reemplazar. Necesaria cuando hay que quitar un carácter específico que no es un espacio en blanco, cuando hay que coincidir por contexto (solo los espacios alrededor de las comas, solo los espacios dentro de cadenas entre comillas), o cuando se necesita un reemplazo dirigido de una sola instancia en vez de un quitado global.

Regex. Necesario cuando el quitado de espacios debe ser condicional según lo que lo rodea. \s+ en regex coincide con cualquier espacio en blanco; combinaciones como \s+(?=[,.]) coinciden con el espacio en blanco solo antes de la puntuación. Para una limpieza condicional compleja, una herramienta de regex es la respuesta correcta.

Cómo funciona la herramienta

La herramienta aplica una expresión regular de JavaScript que coincide con el patrón de espacio en blanco que eliges, y reemplaza las coincidencias por una cadena vacía o por un solo espacio según el modo. Para el modo de todos los espacios en blanco, el regex cubre toda la clase de espacio en blanco de Unicode más los caracteres de ancho cero y el BOM, que técnicamente no son espacio en blanco pero se comportan como tal para fines de limpieza.

El rendimiento es lineal según el tamaño de la entrada. El texto de varios megabytes se ejecuta en bastante menos de un segundo.

Consejos de flujo de trabajo

Usa por defecto «reducir varios espacios». Arregla el 80 % de las necesidades reales de limpieza sin efectos secundarios destructivos. Recurre a los modos más agresivos solo cuando reducir no cumpla la tarea.

Recorta siempre las direcciones de correo al capturarlas. Si controlas el formulario, recorta el espacio en blanco inicial y final antes de la validación. Si no, pasa los correos capturados por el modo de recorte de esta herramienta antes de seguir procesándolos.

Audita los caracteres invisibles con el Contador de Caracteres primero. Si una línea «se ve bien» pero no coincide, pégala en el Contador de Caracteres y compara el conteo con lo que esperas. Una discrepancia apunta a caracteres invisibles que el quitado de espacios específico no atrapará.

Preguntas frecuentes

¿Qué cuenta como «espacio en blanco»?

En los modos específicos (solo espacios, solo tabulaciones, solo saltos de línea), solo el carácter literal que elijas. En el modo «todos los espacios en blanco», toda la categoría de espacio en blanco de Unicode más los caracteres de ancho cero y la marca de orden de bytes. Cualquier cosa que sea invisible o que se comporte como un espacio en blanco, aunque técnicamente esté clasificada de otra forma.

¿Conserva los saltos de línea?

Por defecto, sí. Solo los modos «quitar solo los saltos de línea» y «quitar todos los espacios en blanco» afectan los saltos de línea. Los otros cuatro modos conservan la estructura de líneas.

¿Maneja los espacios de no separación?

El modo «todos los espacios en blanco» sí. El modo «quitar todos los espacios» (que apunta solo al espacio ASCII normal, U+0020) no. Si tu texto contiene espacios de no separación disfrazados de normales, usa el modo de todos los espacios en blanco.

¿Por qué no quitó un espacio que veo?

Casi con seguridad es un carácter invisible que parece un espacio. Prueba el modo de todos los espacios en blanco. Si aún no lo atrapa, pega la entrada en el Contador de Caracteres para identificar qué carácter hay en realidad.

¿Puedo conservar unos espacios y quitar otros?

Con esta herramienta no. El quitado condicional de espacios, como «quitar los espacios solo entre dígitos», requiere coincidencia de regex con contexto, que es para lo que sirve la herramienta Buscar y Reemplazar.

¿Modifica los saltos de línea en Windows de forma distinta que en Mac?

La herramienta trata tanto \n (Unix/Mac) como \r\n (Windows) como saltos de línea, así que el comportamiento es consistente sin importar de dónde venga el texto. La salida usa el estilo Unix \n por defecto.

Relacionados

Publicidad

Aprende más sobre eliminar espacios