[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: regexp para extrair domínio de uma URL
From: |
Cristiano |
Subject: |
Re: regexp para extrair domínio de uma URL |
Date: |
Tue, 03 Nov 2009 17:00:05 -0000 |
User-agent: |
eGroups-EW/0.82 |
--- Em address@hidden, "Julio C. Neves" <julio.neves@...> escreveu
>
> Fala Cristiano,
> no pastebin vc colocou assim:
>
> ((coop|blog|radio|flog|vlog|wiki|taxi)|([[:alpha:]]{3}))\.
> para fazer o que vc quer, basta tornar todo este bloco opcional. E para
> isso, basta:
> (((coop|blog|radio|flog|vlog|wiki|taxi)|([[:alpha:]]{3}))\.)?
>
> OBS: Assim como vc descreveu TDL possíveis, eu faria o mesmo para os
> prefixos. Assim eu trocaria o [[:alpha:]]* inicial, por:
>
> (www|...)
Grande mestre, boa tarde.
A ER no pastebin tinha erros. Mas, seguindo seu raciocínio, quase cheguei lá.
Reformulei o código, mas ainda me escapa algo. Veja:
http://pastebin.com/f7ff2e392
O problema ainda diz respeito aos domínios de universidades. Veja o destaque.
Neste caso, eu gostaria de pegar apenas a raiz do domínio (uem.br) e não o
subdomínio (DCE).
Será que é o máximo em que se pode chegar genericamente ou ainda há o que
melhorar?
PS: Pessoal, por favor, vamos manter as mensagens organizadas. Criem novas
threads em novas mensagem e não iniciar novos tópicos como respostas a tópicos
existentes, como fez o Bruno Romano Mulle nesta thread. Não adianta mudar o
subject pois existem referências internas à mensagem. Fica uma zona para quem
segue os posts encadeados.