php结合正则批量抓取网页中邮箱地址,php中Snoopy类用法实例

By admin in 编程 on 2019年7月16日

正文实例陈述了php中Snoopy类用法。共享给大家供大家仿照效法。具体深入分析如下:

本文实例呈报了php基于Snoopy深入分析网页html的法子。分享给我们供我们参谋。具体完结形式如下:

php怎么样抓取网页中国聚集国人民邮政分公司公司箱地址,下边我就给大家享受三个用php抓取网页东方之珠中华电力有限集团子邮箱的实例。

此地演示了php中如何通过Snoopy抓取网页音讯

set_time_limit(0);
$user = array('20517', '20518');
header("content-Type: text/html; charset=utf-8");
require_once './Snoopy.php';
$snoopy = new Snoopy();
//$uri = 'http://www.juzimi.com/meitumeiju';
$uri = 'http://www.juzimi.com/meitumeiju?page=1';
$snoopy->fetch($uri);
$con = $snoopy->getResults();
$doc = new DOMDocument();
$doc->loadHTML($con);
/* make a result array ... */
$result = [];
/* go through all nodes which have class="baby" ... */
$i = 0;
foreach( ( new DOMXPath( $doc ) )->query( '//*[@id="bdshare"]' ) as $element ) {
  $row = $doc->saveHTML($element);
  $start = stripos($row, '{');
  $end = stripos($row, '}');
  $len = $end - $start + 1;
  $json = substr($row, $start, $len);
  $json = str_replace("'", '"', $json);
  $obj = json_decode($json);
  $pic = $obj->pic;
  $desc = $obj->desc;
  $filename = '/Uploads/meiju/card' . date('ymdhis') . $i . '.png';
  $file = '/alidata/www/test' . $filename;
  $image = file_get_contents($pic);
  file_put_contents($file, $image);
}
<?php
  $url='//www.jb51.net'; //要采集的网址 
  $content=file_get_contents($url);
  //echo $content;
  function getEmail($str) {
  //$pattern = "/([a-z0-9]*[-_\.]?[a-z0-9]+)*@([a-z0-9]*[-_]?[a-z0-9]+)+[\.][a-z]{2,3}([\.][a-z]{2})?/i";
  $pattern = "/([a-z0-9\-_\.]+@[a-z0-9]+\.[a-z0-9\-_\.]+)/";
  preg_match_all($pattern,$str,$emailArr);

  return $emailArr[0];
  }
  print_r( getEmail($content));
  ?>

snoopy类的下载地址:

盼望本文所述对我们的php程序设计具备帮忙。

方法2:

/*
You need the snoopy.class.php from 
http://snoopy.sourceforge.net/
*/
include("snoopy.class.php");
$snoopy = new Snoopy;
// need an proxy?:
//$snoopy->proxy_host = "my.proxy.host";
//$snoopy->proxy_port = "8080";
// set browser and referer:
$snoopy->agent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)";
$snoopy->referer = "http://www.jonasjohn.de/";
// set some cookies:
$snoopy->cookies["SessionID"] = '238472834723489';
$snoopy->cookies["favoriteColor"] = "blue";
// set an raw-header:
$snoopy->rawheaders["Pragma"] = "no-cache";
// set some internal variables:
$snoopy->maxredirs = 2;
$snoopy->offsiteok = false;
$snoopy->expandlinks = false;
// set username and password (optional)
//$snoopy->user = "joe";
//$snoopy->pass = "bloe";
// fetch the text of the website www.google.com:
if($snoopy->fetchtext("http://www.google.com")){ 
  // other methods: fetch, fetchform, fetchlinks, submittext and submitlinks
  // response code:
  print "response code: ".$snoopy->response_code."<br/>\n";
  // print the headers:
  print "<b>Headers:</b><br/>";
  while(list($key,$val) = each($snoopy->headers)){
    print $key.": ".$val."<br/>\n";
  }
  print "<br/>\n";

  // print the texts of the website:
  print "<pre>".htmlspecialchars($snoopy->results)."</pre>\n";
}
else {
  print "Snoopy: error while fetching document: ".$snoopy->error."\n";
}

您只怕感兴趣的篇章:

  • PHP如何用正则抓取页面中的网址
  • PHP正则表达式抓取有个别标签的一定属性值的不二等秘书技
  • php结合正则批量抓取网页中国聚焦国人民邮政根据地公司箱地址
  • php使用curl和正则表明式抓取网页数据示例
  • PHP搜集利器 Snoopy
    试用心得
  • PHP采撷类snoopy详细介绍(snoopy使用教程)
  • snoopy
    庞大的PHP收集类使用实例代码
  • 听大人讲Snoopy的PHP近似完美获取网址编码的代码
  • PHP采撷类Snoopy抓取图片实例
  • snoopy
    PHP版的互连网客户端提供本地下载
  • php中Snoopy类用法实例
  • PHP正则+Snoopy抓取框架达成的抓取天猫店信誉功效实例
<?php 
$url='//www.jb51.net'; //当页已留邮箱
$content=file_get_contents($url);             //获取页面内容
function getEmail($str) {                 //匹配邮箱内容
$pattern = "/([a-z0-9\-_\.]+@[a-z0-9]+\.[a-z0-9\-_\.]+)/"; 
preg_match_all($pattern,$str,$emailArr); 
return $emailArr[0]; 
} 
print_r( getEmail($content)); 
?>

希望本文所述对大家的php程序设计有所帮衬。

如上所述就是本文的全体内容了,希望大家能够欣赏。

您可能感兴趣的篇章:

  • PHP怎么样用正则抓取页面中的网站
  • PHP正则表明式抓取有个别标签的特定属性值的办法
  • php结合正则批量抓取网页中国聚集国人民邮政总部公司箱地址
  • php使用curl和正则表明式抓取网页数据示例
  • PHP搜集利器 Snoopy
    试用心得
  • PHP收罗类snoopy详细介绍(snoopy使用教程)
  • snoopy
    庞大的PHP采撷类使用实例代码
  • 基于Snoopy的PHP近似完美获取网址编码的代码
  • PHP收集类Snoopy抓取图片实例
  • snoopy
    PHP版的网络客户端提供本地下载
  • php基于Snoopy深入分析网页html的法子
  • PHP正则+Snoopy抓取框架完成的抓取Tmall店信誉功效实例

你或者感兴趣的稿子:

  • PHP怎么样用正则抓取页面中的网站
  • PHP正则表明式抓取有些标签的一定属性值的方法
  • php使用curl和正则表达式抓取网页数据示例
  • PHP搜罗利器 Snoopy
    试用心得
  • PHP采撷类snoopy详细介绍(snoopy使用教程)
  • snoopy
    庞大的PHP搜聚类使用实例代码
  • 听大人说Snoopy的PHP近似完美获取网址编码的代码
  • PHP搜聚类Snoopy抓取图片实例
  • snoopy
    PHP版的网络客户端提供本地下载
  • php基于Snoopy解析网页html的艺术
  • php中Snoopy类用法实例
  • PHP正则+Snoopy抓取框架完结的抓取Taobao店信誉功效实例

发表评论

电子邮件地址不会被公开。 必填项已用*标注

网站地图xml地图
Copyright @ 2010-2019 澳门新葡亰官网app 版权所有