Operaciones con listas: la guía completa (2026)
Ordenar, deduplicar, mezclar, prefijo, sufijo, reformatear. Seis operaciones cubren cerca del 95 % de la manipulación de listas que cualquier analista, desarrollador o redactor llega a necesitar. El árbol de decisión, la guía herramienta por herramienta y los patrones de flujo que componen el ahorro.
Las seis operaciones
Toda tarea de manipulación de listas en cualquier flujo se reduce a una o más de seis operaciones:
- Ordenar. Reordenar por orden alfabético, numérico, de longitud o aleatorio.
- Deduplicar. Quitar las líneas duplicadas, de forma opcional sin distinguir mayúsculas y con recorte.
- Mezclar. Reordenar al azar con una distribución uniforme.
- Prefijo / sufijo. Envolver cada línea con texto arbitrario en ambos lados.
- Reformatear. Convertir entre formas de lista: una por línea, separada por comas, arreglo JSON, cláusula IN de SQL.
- Filtrar. Conservar o quitar las líneas que coinciden con un patrón.
Dominar estas seis cubre prácticamente todo problema de listas de texto con el que se topa un analista, un desarrollador, un redactor o alguien de operaciones. El resto de este artículo recorre cada una, con la herramienta a usar y las trampas a evitar.
1. Ordenar
Cuatro órdenes cubren los casos de uso:
- Alfabético (A–Z o Z–A). El predeterminado. Úsalo para nombres, palabras, identificadores.
- Numérico. Úsalo para precios, ID, conteos. La trampa: el orden alfabético trata «10» como menor que «9». Elige siempre el orden numérico para los números.
- Por longitud. Útil para encontrar la URL más larga, la contraseña más corta, el elemento atípico.
- Aleatorio. El mismo efecto que mezclar. Usa el orden aleatorio cuando el destino espera un solo reordenamiento.
El orden menos obvio: la sensibilidad a mayúsculas. Banana se ordena antes que apple en el orden ASCII que distingue mayúsculas (las mayúsculas van antes que las minúsculas). Para listas legibles, usa casi siempre el orden sin distinguir mayúsculas.
Usa la herramienta Ordenar Líneas para ordenar en un pegado. Para más sobre los cuatro órdenes, mira cómo ordenar líneas alfabéticamente.
2. Deduplicar
Tres variantes de deduplicación cubren la mayoría de las necesidades:
- Estricta. Quitar solo los duplicados de coincidencia exacta.
- Sin distinguir mayúsculas. Tratar
Appleyapplecomo la misma línea. - Con espacios normalizados. Tratar
" alice "y"alice"como la misma línea recortando antes de comparar.
La deduplicación también tiene una cuestión de estabilidad. La convención: conservar la primera aparición y descartar las posteriores. Esto conserva el orden de entrada de las líneas que sobreviven, que suele ser lo que quieres.
Usa la herramienta Eliminar Duplicados para deduplicar en un pegado. Para la guía más a fondo, mira cómo eliminar líneas duplicadas. Para quitar los espacios sueltos y dobles que hacen que líneas casi idénticas no coincidan, pasa primero el texto por la herramienta Eliminar Espacios.
3. Mezclar
Mezclar es ordenar al azar con un detalle crítico: el algoritmo. El estándar para una permutación uniformemente aleatoria es Fisher-Yates (también llamado la mezcla de Knuth). Produce cada una de las n! ordenaciones con la misma probabilidad en tiempo O(n).
La mezcla ingenua que a veces se escribe (ordenar por una clave aleatoria, o intercambiar pares al azar de forma repetida) produce distribuciones no uniformes. Para listas pequeñas esto rara vez importa; para listas más grandes usadas en contextos científicos o estadísticos, sí.
Casos de uso de la mezcla:
- Aleatorizar el orden de las preguntas en un cuestionario.
- Repartir los datos de prueba entre pliegues para la validación cruzada.
- Elegir un subconjunto aleatorio (mezclar y luego tomar los primeros N).
- Quitar el orden accidental de una lista (mezclar y luego ordenar por la clave deseada).
Usa la herramienta Mezclar Líneas para la mezcla Fisher-Yates en el navegador. Para la explicación del algoritmo, mira cómo mezclar líneas (Fisher-Yates).
4. Prefijo y sufijo
Agregar el mismo texto al inicio o al final de cada línea. Suena trivial. El motivo de que tenga su propia herramienta: hacerlo a mano para 50 líneas es tedioso; hacerlo de forma consistente en miles de líneas es prácticamente obligatorio para las salidas aptas para código.
Cinco patrones comunes:
| Objetivo | Prefijo | Sufijo | Ejemplo de resultado |
|---|---|---|---|
| Lista HTML | <li> | </li> | <li>item</li> |
| Viñeta de Markdown | - | (vacío) | - item |
| Arreglo JSON de cadenas | " | ", | "item", |
| Cláusula IN de SQL | ' | ', | 'item', |
| Prefijo de fila CSV | row, | (vacío) | row,item |
El paso de limpieza: después de una pasada de prefijo/sufijo de «arreglo JSON» o «cláusula IN de SQL», la última línea todavía tiene una coma al final que hay que quitar. La herramienta Prefijo/Sufijo de TextKit ofrece un interruptor de «sin separador final» que lo maneja de forma automática.
Usa la herramienta Agregar Prefijo y Sufijo. Para más sobre los patrones, mira cómo agregar prefijo y sufijo a cada línea.
5. Reformatear
Las listas llegan en formas que no coinciden con lo que el destino espera. Seis reformateos comunes:
- Una por línea ⇄ cadena separada por comas
- Una por línea → arreglo JSON
- Una por línea → cláusula IN de SQL
- Una por línea →
<ul>de HTML - Separada por tabuladores → tabla de Markdown
- Separada por comas → una por línea
La mayoría son prefijo/sufijo combinados con una operación de envoltura (abrir el arreglo, cerrar el arreglo). El análisis a fondo formatear listas para SQL/JSON/HTML cubre cada uno con ejemplos resueltos.
6. Filtrar
Conservar o quitar las líneas que coinciden con un patrón. Casos de uso:
- Conservar solo las líneas que contienen
errorpara una revisión rápida de registros. - Quitar las líneas que contienen
internal-domain.comde una lista de correos. - Conservar solo las líneas que parecen URLs.
- Quitar las líneas en blanco.
Para filtros de subcadena simples, la herramienta Buscar y Reemplazar con regex activada lo maneja. Para filtros más complejos, baja a grep, awk o una línea de Python.
El flujo de trabajo compuesto
La mayoría de los problemas reales de listas encadenan dos o tres operaciones:
- «Tengo una lista con duplicados y la quiero ordenada alfabéticamente». Deduplica y luego ordena.
- «Tengo una columna de CSV que necesito como cláusula IN de SQL». Extrae la columna, deduplica, aplica prefijo y sufijo con comillas simples y envuelve en paréntesis.
- «Tengo 100 nombres que necesito aleatorizar para un concurso». Mezcla y toma los primeros N.
- «Tengo una lista de URLs y quiero encontrar la más larga». Ordena por longitud de mayor a menor y toma la primera.
Cada operación corre en el navegador, lleva un pegado y produce una salida que puedes pegar en la siguiente operación. La velocidad que se acumula es el valor.
Las herramientas de un vistazo
| Operación | Herramienta de TextKit | Mejor para listas de hasta |
|---|---|---|
| Ordenar | Ordenar Líneas | 1 M líneas |
| Deduplicar | Eliminar Duplicados | 1 M líneas |
| Mezclar | Mezclar Líneas | 500 k líneas |
| Prefijo / sufijo | Agregar Prefijo y Sufijo | 1 M líneas |
| Filtrar | Buscar y Reemplazar (regex) | 1 M líneas |
Pasado 1 M de líneas, baja a la línea de comandos. Dentro de 1 M, el navegador es más rápido que abrir cualquier otra cosa.
Para los análisis a fondo de cada operación: cómo ordenar líneas, cómo mezclar líneas, cómo agregar prefijo y sufijo, cómo eliminar líneas duplicadas, formatear listas para SQL/JSON/HTML.
Preguntas frecuentes
¿Cuál es la diferencia entre ordenar y mezclar?
Ordenar produce una salida determinista: la misma entrada siempre produce la misma salida. Mezclar produce una salida aleatoria: la misma entrada produce una salida distinta en cada ejecución. Ambas reordenan; el determinismo es la única diferencia.
¿Por qué usar una herramienta en lugar de Excel para el trabajo con listas?
Excel tarda en abrir, tarda en copiar y pegar listas grandes, y exige un viaje de ida y vuelta por las celdas de la hoja. Para listas de 50 a 50 000 elementos, las herramientas en el navegador son de 10 a 100 veces más rápidas que el viaje por la hoja de cálculo.
¿Cuál es el límite de tamaño de las herramientas de listas en el navegador?
La mayoría de las herramientas en el navegador manejan hasta un millón de líneas sin problema. Pasado eso, el rendimiento del área de texto del navegador se degrada. Para listas de más de un millón, baja a una herramienta de línea de comandos (sort, awk, jq).
¿Cómo conservo el orden al quitar duplicados?
Usa una deduplicación estable que conserve la primera aparición y descarte las posteriores. La mayoría de las herramientas de deduplicación en el navegador (incluida la versión de TextKit) lo hacen por defecto. Deduplicación sin orden explícita.
¿Estas herramientas pueden manejar datos de varias columnas?
Las herramientas de una sola línea (ordenar, deduplicar, mezclar, prefijo/sufijo) tratan cada línea como un solo elemento. Para datos de varias columnas separados por tabuladores, ordenan y deduplican por toda la fila, no por una columna específica. Para operaciones por columna, usa Excel, jq o awk.
¿Por qué Fisher-Yates es el algoritmo de mezcla estándar?
Porque produce una permutación uniformemente aleatoria en tiempo O(n), con cada una de las n! ordenaciones igual de probable. Los algoritmos de mezcla ingenuos (ordenar por una clave aleatoria, intercambios repetidos) producen distribuciones no uniformes que sesgan hacia ciertas ordenaciones.
Seguir leyendo
Escrito por SAVI. Creamos las herramientas sobre las que escribimos. Prueba las herramientas de operaciones con listas que usamos en este artículo.