Contar frecuencia de palabras en archivo texto Linux
Contar frecuencia de palabras en archivo texto Linux

Linux: Contar frecuencia de palabras en archivo de texto

Los procesadores de texto y las aplicaciones para tomar notas, con Interfaz de usuario gráfica (GUI), tienen información o indicadores sobre el documento, como el recuento de páginas, palabras y caracteres, una lista de encabezados en procesadores de texto, una tabla de contenido en algunos editores, etc. y encontrar la aparición de palabras o frases es tan fácil como pulsar Ctrl + F, y escribir los caracteres que deseas buscar.

Una GUI hace que todo sea fácil, pero ¿qué sucede cuando solo puedes trabajar desde la línea de comandos y deseas verificar el número de veces que aparece una palabra, frase o carácter en un archivo de texto? Es casi tan fácil como cuando utilizas una GUI, siempre y cuando tengas el comando correcto y estoy a punto de explicarte cómo se hace.

Supongamos que tienes un archivo ejemplo.txt que contiene la siguiente oración:

Integer mauris quam, finibus eget consequat eget, ullamcorper eget diam. Nulla sit amet finibus turpis. Ut vel justo lobortis, pulvinar ligula nec, ullamcorper ipsum. Praesent sollicitudin urna sit amet egestas aliquam. Mauris ultrices id dolor ac vestibulum. Mauris again.


Usar grep para contar repeticiones de palabras

Puede usar el comando grep para contar el número de veces que aparece “mauris” en el archivo de muestra.

grep -o -i mauris ejemplo.txt | wc -l
Contar repeticiones de palabras con grep
Contar repeticiones de palabras con grep

El uso grep -c solo contará el número de líneas que contienen la palabra coincidente en lugar del número total de coincidencias. La opción -o es lo que le dice a grep que muestre cada coincidencia en una línea única y luego wc -l le dice a wc que cuente el número de líneas. Así es como se deduce el número total de palabras coincidentes.


Un enfoque diferente es transformar el contenido del archivo de entrada con el comando tr para que todas las palabras estén en una sola línea y luego usar grep -c para contar ese número de coincidencias.

tr '[:space:]' '[\n*]' < ejemplo.txt | grep -i -c mauris
Contar coincidencia de palabras con tr y grep
Contar coincidencia de palabras con tr y grep

¿Te ha gustado este artículo? Sígue este blog en su fanpage de FacebookTwitterInstagram y/o YouTube para que no te pierdas del mejor contenido informático y hacking!

¿Es así como verificas la ocurrencia de palabras desde tu terminal? Comparte tu experiencia con este truco Linux y cuéntanos si tienes otra forma de realizar la tarea. 😮 ¡No olvides compartirlo! :’)

Mi Carro Close (×)

Tu carrito está vacío
Ver tienda