shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: regexp para extrair domínio de uma URL


From: Cristiano
Subject: Re: regexp para extrair domínio de uma URL
Date: Tue, 03 Nov 2009 17:00:05 -0000
User-agent: eGroups-EW/0.82

--- Em address@hidden, "Julio C. Neves" <julio.neves@...> escreveu
>
> Fala Cristiano,
> no pastebin vc colocou assim:
> 
> ((coop|blog|radio|flog|vlog|wiki|taxi)|([[:alpha:]]{3}))\.
> para fazer o que vc quer, basta tornar todo este bloco opcional. E para
> isso, basta:
> (((coop|blog|radio|flog|vlog|wiki|taxi)|([[:alpha:]]{3}))\.)?
> 
> OBS: Assim como vc descreveu TDL possíveis, eu faria o mesmo para os
> prefixos. Assim eu trocaria o [[:alpha:]]* inicial, por:
> 
> (www|...)

Grande mestre, boa tarde.

A ER no pastebin tinha erros. Mas, seguindo seu raciocínio, quase cheguei lá.

Reformulei o código, mas ainda me escapa algo. Veja:

http://pastebin.com/f7ff2e392

O problema ainda diz respeito aos domínios de universidades. Veja o destaque. 
Neste caso, eu gostaria de pegar apenas a raiz do domínio (uem.br) e não o 
subdomínio (DCE).

Será que é o máximo em que se pode chegar genericamente ou ainda há o que 
melhorar?

PS: Pessoal, por favor, vamos manter as mensagens organizadas. Criem novas 
threads em novas mensagem e não iniciar novos tópicos como respostas a tópicos 
existentes, como fez o Bruno Romano Mulle nesta thread. Não adianta mudar o 
subject pois existem referências internas à mensagem. Fica uma zona para quem 
segue os posts encadeados.



reply via email to

[Prev in Thread] Current Thread [Next in Thread]