博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
php 获取网络文件数据格式化,Tmall网页采集数据格式化分析类
阅读量:5742 次
发布时间:2019-06-18

本文共 1449 字,大约阅读时间需要 4 分钟。

Tmall网页采集数据格式化分析类

c77d547ea6e98d076658bc2d7a226417.png

代码使用 simple_html_dom 类库 ,具体可以在github上搜索下,使用方法也很简单,功能非常强大,可以按照ID,标签,Class,属性等对数据进行解析。

//天猫数据格式化类

class TmallHtmlFormat{

public $obj = "";

public $productTitle = "";

public $productImgHref = "";

public $productImg = "";

public $productShop = "";

public $productPrice = "";

public function setObj($obj){

$this->obj = $obj;

}

public function getProductInfo(){

$return ['title'] = $this->getTitle();

$return ['shop'] = $this->getShop();

$return ['price'] = $this->getPrice();

$return ['img'] = $this->getProductImg();

return $return;

}

private function getTitle(){

//标题

$productTitle = $this->obj->find('p.productTitle');

if(is_array($productTitle) && $productTitle){

return $productTitle[0]->find('a',0)->title;

}

}

private function getShop(){

//店铺名称

$productShop = $this->obj->find('div.productShop');

if(is_array($productShop) && $productShop){

$return = array($productShop[0]->find('a',0)->plaintext,$productShop[0]->find('a',0)->href);

return $return;

}

}

private function getPrice(){

$productPrice = $this->obj->find('p.productPrice');

if(is_array($productPrice) && $productPrice){

return $productPrice[0]->find('em',0)->title;

}

}

private function getProductImg(){

$productImg = $this->obj->find('div.productImg-wrap');

if(is_array($productImg) && $productImg){

$return = array($productImg[0]->find('img',0)->src,$productImg[0]->find('a',0)->href);

return $return;

}

}

}

开心洋葱 , 版权所有丨如未注明 , 均为原创丨未经授权请勿修改 , 转载请注明Tmall网页采集数据格式化分析类!

你可能感兴趣的文章
【http】post和get请求的区别
查看>>
TFS强制撤销某个工作区的文件签出记录
查看>>
EL表达式无法显示Model中的数据
查看>>
ps6-工具的基础使用
查看>>
灵活运用 SQL SERVER FOR XML PATH
查看>>
linux下使用过的命令总结(未整理完)
查看>>
时间助理 时之助
查看>>
英国征召前黑客组建“网络兵团”
查看>>
Silverlight 2.5D RPG游戏“.NET技术”技巧与特效处理:(十二)魔法系统
查看>>
PHP 命令行模式实战之cli+mysql 模拟队列批量发送邮件(在Linux环境下PHP 异步执行脚本发送事件通知消息实际案例)...
查看>>
pyjamas build AJAX apps in Python (like Google did for Java)
查看>>
LAMP环境搭建1-mysql5.5
查看>>
centos5.9使用RPM包搭建lamp平台
查看>>
Javascript String类的属性及方法
查看>>
[LeetCode] Merge Intervals
查看>>
Ubuntu 14.04 vsftp refusing to run with writable root inside chroot问题解决方法
查看>>
Intellij IDEA远程调试tomcat
查看>>
Struts2 学习小结
查看>>
烂泥:wordpress迁移到docker
查看>>
测试工具综合
查看>>