shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Erro num script pra contar frequência das palavras


From: Helton Moraes
Subject: Erro num script pra contar frequência das palavras
Date: Mon, 10 May 2010 14:24:56 -0300

Caros colegas

Primeiramente, caso alguém conheça alguma técnica ou programa ou script
pronto (link) para o que estou tentando fazer, aceito a sugestão! Vamos lá:

Estou encarregado de dar uma melhorada no estilo de um texto publicitário, e
como bom nerd pretendo usar o shell para isso, contando as palavras
repetidas de um arquivo de texto. Para isso, tentei usar um oneliner com a
seguinte sequência:

cat (carrega o arquivo)
tr (trocar espaços por novas linhas \n)
uniq -ci (contar as linhas repetidas ignorando maiúscula/minúscula)
sort -r (para que as palavras mais frequentes apareçam na parte baixa do
terminal assim que eu der ENTER)

ficou assim:

cat /home/helton/Desktop/test.txt | tr " " "\n" | uniq -c | sort -r

O PROBLEMA é que o resultado é como o seguinte:

1 o
1 problema
1 é
1 que
1 o
1 resultado
1 digo
1 o
1 resultado
1 repito
1 o
1 resultado
1 aparece
1 assim

ou seja, mesmo que tenha palavras repetidas no arquivo ele aparece uma
ocorrência por linha precedido do 1.

Então, como bom pai (do script), pergunto: "onde foi que eu errei?"

Obrigado

Helton


[As partes desta mensagem que não continham texto foram removidas]



reply via email to

[Prev in Thread] Current Thread [Next in Thread]