Récupérer tous les mails d’une page Web via un script PHP

Dans le cadre de certaines activités, nous avons besoin d’automatiser la récupération de nombreux mails dans une page web, en effet pour certaines applications, nous avons de nombreux listings d’adresse et seul les mails nous intéresse.

Via le script suivant, nous avons maintenant une parfaite automatisation de récupération des mails sur une URL bien défini.

Celui s’occupe d’extraire tous les mails de la page web défini en amont et de les classer dans un tableau afin d’y voir plus clair.

<html>
<head>
<title>Récupération mail</title>
</head><body>

<pre>
<?php
# Adresse du site à "exploiter"
$url = 'http://www.recuperer-les-mails.com';   

$ch = curl_init();
$timeout = 10;
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
$data = curl_exec($ch);
curl_close($ch);



# Récupération des emails
preg_match_all('`[a-zA-Z0-9_\.]+@[a-zA-Z0-9\-]+\.[a-zA-Z0-9\-\.]+`m', $data, $emails);

# Affichage du tableau sans doublons
$emails2= array_unique($emails[0]);
# Affichage du tableau
echo implode("
", $emails2);


?>
</pre>
<p></body>
</html></code>