[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [shell-script] Identificando Linhas duplicadas em um arquivo.
From: |
Jose Carlos (Gmail) |
Subject: |
Re: [shell-script] Identificando Linhas duplicadas em um arquivo. |
Date: |
Fri, 07 May 2010 16:16:07 -0300 |
User-agent: |
Mozilla/5.0 (Windows; U; Windows NT 6.1; pt-BR; rv:1.9.1.9) Gecko/20100317 Thunderbird/3.0.4 |
Em 07/05/2010 15:00, address@hidden escreveu:
>
> Olá, amigão.
>
> Veja se isto te ajuda:
>
> O arquivo:
> groo@NOTEERICHDS:~$ cat teste.txt
> a
> a
> b
> b
> c
> c
> d
> d
> e
> e
> e
> e
> e
> f
> f
> f
> g
>
> Bom dia galera, como faço para identificar se ha linhas duplicadas
> > em uma arquivo com mais de 20.000 linhas?
> groo@NOTEERICHDS:~$ uniq -c teste.txt
> 2 a
> 2 b
> 2 c
> 2 d
> 5 e
> 3 f
> 1 g
>
> ual comando eu utilizo pra fazer essa identificação e pra fazer a
> > exclusão dessas linhas duplicadas?
> groo@NOTEERICHDS:~$ sort -u teste.txt > testesemduplicados.txt
> groo@NOTEERICHDS:~$ cat testesemduplicados.txt
> a
> b
> c
> d
> e
> f
> g
> groo@NOTEERICHDS:~$
>
> flw!
>
> On Sex 07/05/10 10:35 , "ogaihtnota10" address@hidden
> <mailto:ogaihtnota10%40gmail.com> sent:
> > Bom dia galera, como faço para identificar se ha linhas duplicadas
> > em uma arquivo com mais de 20.000 linhas?
> > Qual comando eu utilizo pra fazer essa identificação e pra fazer a
> > exclusão dessas linhas duplicadas?
> > Será que poderiam me ajudar?
> > Grato.
> >
> >
>
>
Caro amigo,
Caso voce queira remover direto as linhas duplicadas, utilize da
seguinte forma
sort -u <nome do arquivo> | grep -v ^$ | grep -v user > <novo nome de
arquivo>
Jose Carlos Oliveira
Consultor de Redes SR
http://sixsideweb.blogspot.com
[As partes desta mensagem que não continham texto foram removidas]