Magazine High tech

Comment extraire les adresses email d’une page ?

Publié le 23 décembre 2008 par Annuairedugeek

spam geek

Surement très utilisé par les spammeurs, la récupération d’email en “clair” sur une page est une chose assez simple à réaliser. Il suffit de bien savoir manier Unix, ce qui ne devrait pas poser beaucoup de problèmes aux geeks qui suivent ce blog.

Vous avez besoin d’un serveur ou directement sur votre machine unix et de cette commande:

echo exec(”wget -q -O - http://www.annuairedugeek.com/contact.html | grep -oe ‘\w*.\w*@\w*.\w*.\w\+’ | sort -u”, $result);

Il faut bien entendu adapter l’url au site que vous voulez explorer ;)

On peut donc facilement comprendre que certains site, notamment les réseaux sociaux comme Facebook, protègent les email en les transformant en image ou en les  affichant de cette façon annuairedugeek[at]gmail[dot]com.

Une autre solution est d’utiliser la librairie CURL de PHP. Mais j’en parlerai un autre jour…

Partagez cet article avec les autres geeks Facebook Scoopeo Blogasty del.icio.us

Retour à La Une de Logo Paperblog

A propos de l’auteur


Annuairedugeek 298 partages Voir son profil
Voir son blog

l'auteur n'a pas encore renseigné son compte l'auteur n'a pas encore renseigné son compte

Dossiers Paperblog

Magazines