shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [shell-script] Re: Obter informações de um a rquivo HTML (Shell Scri


From: phfbettega
Subject: Re: [shell-script] Re: Obter informações de um a rquivo HTML (Shell Script)
Date: Thu, 14 Jul 2016 19:33:36 -0300
User-agent: Mozilla/5.0 (X11; Linux x86_64; rv:45.0) Gecko/20100101 Thunderbird/45.2.0

Olá itamar, pensei a mesma coisa. Se o andrelucio puder pegar essa tabela com 
lynx
ou outro seria bem mais fácil, a informaçao sairia toda em uma linha.

Filtrei com sed mas acho que dá pra simplificar rs

sed -nr '/user\.server[0-9]+/ {
:a
s/<[^>]+>//
s/^[[:blank:]]+//
s/[[:blank:]]+$//
H
n
s/<\/tr>//
tprint
ba
:print
x
s/^[^a-z]+//
s/(\n)+/\t/g
s/\t$//
p}' arq-html
user.server1    200.50.222.333:51808    10.255.1.1      Mon Jun  6 07:36:15 2000
user.server2    200.50.222.444:45026    10.255.1.2      Sun Jun  5 02:35:51 2000


Uma coisa que não entendi é que antes eu fiz com o comando g no lugar de x, no 
loop
pra imprimir a saída. Desse jeito a primeira linha sai duplicada, e a outra 
linha com
user.server[0-9] sai grudada com um tab. Procurei o erro mas não consegui achar.

user.server1    200.50.222.333:51808    10.255.1.1      Mon Jun  6 07:36:15 2000
user.server1 200.50.222.333:51808 10.255.1.1 Mon Jun 6 07:36:15 2000user.server2 200.50.222.444:45026 10.255.1.2 Sun Jun 5 02:35:51 2000

sed ... :print;g; ... | cat -vet
user.server1^I200.50.222.333:51808^I10.255.1.1^IMon Jun  6 07:36:15 2000$
user.server1^I200.50.222.333:51808^I10.255.1.1^IMon Jun 6 07:36:15 2000^Iuser.server2^I200.50.222.444:45026^I10.255.1.2^ISun Jun 5 02:35:51 2000$

Abraços Paulo Bettega

On 14-07-2016 19:10, address@hidden [shell-script] wrote:


Caro amigo

Sua pedida é bem limitada e o arquivo de exemplo em si não ajuda muito.

Precisa dizer o que quer com mais detalhes, que tipo de dados quer em cada caso.

Por exemplo, vc pode usar browsers em modo texto que deixariam com uma saída 
limpa, como lynx, links, elinks e
w3m.
Mas assim perderia a informação dos atributos dentro das tags e nesse o caso 
não é recomendado usar esses
browsers se precisar dessa informação especificamente.

De outra forma usar grep, sed, awk e os muitos builtins do bash é o caminho.

Detalhe mais sua necessidade, só pelo que foi dito é difícil direcionar.

[]'s
Itamar




reply via email to

[Prev in Thread] Current Thread [Next in Thread]