shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [shell-script] Editar HTML com SED


From: mop
Subject: Re: [shell-script] Editar HTML com SED
Date: Tue, 03 Apr 2007 23:01:40 -0300

Considerando que minha bola não foi muito fora, me atrevo a dizer que
talvez haja um lugar melhor para você pegar a informação desejada.

Normalmente páginas de notícias têm links para news feeder correspondente, 
identificados como rss, xml, etc. Embora haja algumas diferenças sutis entre 
formatos, um único script poderá tratar todos. Bastará você passar um 
único parâmetro, o endereço do feeder. Além disso, por ser algo padronizado,
não depende da fonte.

Veja no topo da página que usei como exemplo o link RSS. O canal de news
correspondente é:
http://g1.globo.com/Rss2/0,,AS0-6174,00.xml
Veja o código dela, será uma barbada.

Se eu entendi bem, você quer ir um nível além dessa página, possivelmente
o que você quer a a própria página da notícia. Você consegue isso
brincando, usando esses canais específicos e um script bem simples. A ordem
é cronológica reversa, quer dizer, você vai baixando até encontrar o 
primeiro link já baixado anteriormente, podendo abortar imediatamente o 
processo.

Se não existir um canal rss com o que quer, realmente vai ter de garimpar na 
página.

Boa diversão para shell e conectividade.
Sucesso!


------------------------------------------------------------------
>From: "Alain M." <address@hidden>

>O objetivo era perto disso, tanto que tua dica vai me ajudar. Eu quero
>pegar outra parte da tela e as telas seguintes... Já tenho algo
>funcionando, vou enviar em seguida, para quem interessar



reply via email to

[Prev in Thread] Current Thread [Next in Thread]