shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RES: [shell-script] Montar documento atráves de várias paginas html


From: Julio Cezar Neves - DATAPREVRJ
Subject: RES: [shell-script] Montar documento atráves de várias paginas html
Date: Tue, 11 Jan 2005 15:40:43 -0300

Fala Renato,
o programa abaixo, de minha autoria, pesquisa a partir da URL informada em
$1 a ocorrencia da cadeia informada em $2. Faça as adaptações necessárias
para o seu caso.

=========================================>8CorteAqui8<======================
=====================
#!/bin/bash
trap 'clear; echo "Relacao de sitios pesquisados:"; more ArqSitio; exit' 0 2
3 15
> achei
echo "$1" > ArqSitio
while read Sitio
do
    VarTrab=$(lynx -dump "$Sitio")
    echo "$VarTrab" | grep "$2" >> achei # achei terá as linhas que contêm a
cadeia pesquisada
    echo "$VarTrab" | sed '1,/^References$/d;/^$/d;s/^ *[0-9]*. //' >>
ArqSitio
done < ArqSitio
=========================================>8CorteAqui8<======================
=====================

[ ]s,
Julio
:wq

| -----Mensagem original-----
| De: Renato L. Sousa [mailto:address@hidden]
| Enviada em: terça-feira, 11 de janeiro de 2005 13:02
| Para: address@hidden
| Assunto: [shell-script] Montar documento atráves de várias 
| paginas html
| 
| 
| 
| Olá amigos Shelleiros....,
| 
| Estou precisando desenvolver um shell script que leia uma 
| página html e 
| armazene seu conteudo num arquivo.  Até aí é fácil, mas o 
| problema é q o 
| texto é composto de várias paginas html que são linkadas no final de 
| cada página.
| Exemplo:
| 
| pagina: xxxa.html
| 
| Processo xxxxx
| bla
| bla
| bla
| [proxima pagina]
| 
| Esse link proxima página é que liga todas as páginas html e forma o 
| documento completo.  Sei que o lynx tem uma opção -dump que retorna o 
| conteudo da página, mas como fazer para q o lynx identifique 
| esse link 
| "proxima página" e já monte o documento???
| 
| []'s
| 
| Renato L. Sousa
| 
| 
| ---------------------------------------------------------------------
| Esta lista não admite a abordagem de outras liguagens de 
| programação, como perl, C etc. Quem insistir em não seguir 
| esta regra será moderado sem prévio aviso.
| ---------------------------------------------------------------------
| Sair da lista: address@hidden
| ---------------------------------------------------------------------
| Esta lista é moderada de acordo com o previsto em 
http://www.listas-discussao.cjb.net
---------------------------------------------------------------------
 
Links do Yahoo! Grupos




 




reply via email to

[Prev in Thread] Current Thread [Next in Thread]