shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [shell-script] Deduplicator tabajara!


From: Tiago Peczenyj
Subject: Re: [shell-script] Deduplicator tabajara!
Date: Wed, 10 Apr 2013 14:25:01 -0300

opa

saca so

$ find . -type f | xargs md5 -r | awk 'a[$1]{ print "achei " $2 " tem o
mesmo md5 de " a[$1] ; next; } { a[$1]=$2 }'

estou usando BSD e md5 -r tem o output
MD5 ./nome_do_arquivo1
MD5 ./nome_do_arquivo2
...

se vc rodar o script acima vc vai ver que eu tenho uma saida como esta:

achei ./perlcritic.rc tem o mesmo md5 de ./perlcritic.old

eu forcei a barra e tenho essa configuracao:

1f913b0324086d8d03ba193754c2d383 perlcritic.old
1f913b0324086d8d03ba193754c2d383 perlcritic.rc

agora eu posso substituir a minha mensagem para algo que o shell entenda e
então executar de tres formas

1) fazendo print e adicionando um pipe para o bash
2) posso usar a função system que vai executar o comando
3) escrevo no seguinte formado
<arquivo1> <arquivo2>[NOVA LINHA]
e faço pipe pra um script que sabe ler essas linhas e capturar as
variaveis, de forma a apagar um arquivo e criar o link "duro""

BTW faça uma versão que só escreva o que vc vai fazer e verifique se é isso
mesmo. e ai bola pra frente. De preferencia escreva em um arquivo TUDO o
que vc esta fazendo.



2013/4/10 ainda_uso_win311 <address@hidden>

> **
>
>
> Srs, estou tentando montar um script que localize arquivos identicos,
> apague os duplicados e crie hardlinks para o mesmo inode.
>
> Sem usar programas próprios, como o dedup, queria fazer algo com o md5sum.
> Eu cheguei aqui e empaquei:
>
> find . -type f -exec md5sum {} \; | sort -t" " -k1,1
>
> A ideia é fazer com que ele crie hardlinks com as linhas que tenham o
> md5sum duplicado.
>
> Por favor, sem passar o código pronto, poderiam me "assoprar" por onde
> devo começar a pesquisar? O intuito desse script é apenas para meu estudo
> mesmo.
>
> Obs.: Sim, o filesystem é ext4.
>
> Att.
> Tiago Tarifa Munhoz.
>
>  
>



-- 
Tiago B. Peczenyj
Linux User #405772

http://about.me/peczenyj


[As partes desta mensagem que não continham texto foram removidas]



reply via email to

[Prev in Thread] Current Thread [Next in Thread]