用php抓取百度贴吧指定相册图片

<?php

@set_time_limit(10);
//贴吧名称
$tbname = "mugen";
//相册ID
$tid = "2124904411";
//图册页url模版
$galleryurltpl = "http://tieba.baidu.com/photo/bw/picture/guide?kw=%s&tid=%s";
//本地的目录
$savepath = "R:/images/";
//帖子子文件夹
$filedir = $savepath.$tid;
//图片文件
$filenametpl = $filedir."/%s.jpg";
//图册页url
$galleryurl = sprintf($galleryurltpl, $tbname, $tid);

//返回的json数据
$retjson = file_get_contents($galleryurl);
$retarray = json_decode($retjson, true);
//图片列表
$piclist = $retarray['data']['pic_list'];

//目录是否存在
if(!is_dir($filedir))
mkdir($filedir);
foreach($piclist as $pic){
$pic_id = $pic['img']['original']['id'];
$url = "error.html";
$filename = sprintf($filenametpl, $pic_id);
//下载图片
$imagebin = file_get_contents($url);
//保存图片
file_put_contents($filename,$imagebin);
}
?>

时间： 2024-11-03 11:22:18

用php抓取百度贴吧指定相册图片的相关文章

python抓取百度首页的方法

本文实例讲述了python抓取百度首页的方法.分享给大家供大家参考.具体实现方法如下: ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 import urllib def downURL(url,filename): try: fp=urllib.urlopen(url) except: print('download error') return 0 op=open(filename,'wb') while 1: s=fp.read() if not

版权局：360搜索抓取百度网页快照属侵权

腾讯科技讯在日前举行的"剑网行动"发布会上,针对百度与360之间的"3B大战",国家版权局首次进行了表态--360此举不适用"避风港原则",360要通过网页快照抓取,必须要取得百度公司的授权. 在今年8月29日发生的"3B"大战,曾在业界引起轩然大波.事件起因360综合搜索上线之后,迅速取得10%市场份额,且直接抓取百度网页快照.这引发百度采取反制措施,即用户通过360综合搜索访问百度知道等服务时,将会强行跳转至百度首页.

工具-【在线等/SEO】抓取百度排名快照的功能？

问题描述 [在线等/SEO]抓取百度排名快照的功能? 实在找不到好的思路去**优化抓取百度排名快照**的功能了, 只有在这里发帖了. 有没有哪位朋友做过这样的功能.或者有没有什么 API 可以接入的. 急,感激不尽.(小弟C币不多,有机会给发红包) PS:现在我通过程序能够抓取到排名的快照数据,但是太慢了.有没有其他方式能够更快的获取到排名的数据. 解决方案 // 我的问题没有描述清楚吗? // 为什么没有人来呢. 解决方案二: // 人呢? 我准备发红包了.

零基础写python爬虫之抓取百度贴吧并存储到本地txt文件改进版_python

百度贴吧的爬虫制作和糗百的爬虫制作原理基本相同,都是通过查看源码扣出关键数据,然后将其存储到本地txt文件. 项目内容: 用Python写的百度贴吧的网络爬虫. 使用方法: 新建一个BugBaidu.py文件,然后将代码复制到里面后,双击运行. 程序功能: 将贴吧中楼主发布的内容打包txt存储到本地. 原理解释: 首先,先浏览一下某一条贴吧,点击只看楼主并点击第二页之后url发生了一点变化,变成了: http://tieba.baidu.com/p/2296712428?see_lz=1&pn=

国家版权局裁定360抓取百度内容属侵权

"剑网行动"新闻通气会现场. 12月29日,国家版权局在打击网络侵权盗版专项治理"剑网行动"新闻通气会上指出:360综合搜索提供百度网页快照不适用"避风港原则",对于百度拥有权利的作品,360要通过网页快照抓取,必须要取得百度公司的授权,未经授权随意抓取百度拥有版权的作品属侵权行为. 据了解,国家版权局已经要求360综合搜索进行整改,同时将视360的整改情况再采取进一步的管理措施.这也是自360违规抓取百度内容而引发3B大战以来,国家有关部委的首

版权局首表态：360搜索抓取百度内容须获授权

BiaNews消息12月29日,http://www.aliyun.com/zixun/aggregation/2164.html">国家版权局等4部门昨日联合展示了2012年"剑网行动"的工作成果和视频网站主动监管工作情况.本次"剑网行动"中,国家版权局共接到各地版权行政执法部门报送查办的网络侵权盗版案件282件,关闭违法网站183家. 国家版权局还同时通报了对"3B大战"的最新表态,称360搜索要抓取百度内容需要获得百度

零基础写python爬虫之抓取百度贴吧代码分享_python

这里就不给大家废话了,直接上代码,代码的解释都在注释里面,看不懂的也别来问我,好好学学基础知识去! 复制代码代码如下: # -*- coding: utf-8 -*- #--------------------------------------- # 程序:百度贴吧爬虫 # 版本:0.1 # 作者:why # 日期:2013-05-14 # 语言:Python 2.7 # 操作:输入带分页的地址,去掉最后面的数字,设置一下起始页数和终点页数. # 功能:下载对应页

利用PHP抓取百度阅读的方法示例_php技巧

前言这篇文章主要介绍的是,如何利用PHP抓取百度阅读的方法,下面话不多说,来一起看看吧. 抓取方法如下首先在浏览器里打开阅读页面,查看源代码后发现小说的内容并不是直接写在页面里的,也就是说小说的内容是通过异步加载而来的. 于是将chrome的开发者工具切到network一栏,刷新阅读页面,主要关注的是XHR和script两个分类下. 经过排查,发现在script分类下有个jsonp请求比较像是小说内容,请求的地址是 http://wenku.baidu.com/content/49422a3

php抓取百度快照、百度收录、百度热词程序代码

代码如下复制代码 <? /* 抓取百度收录代码 */ function baidu($s){ $baidu="http://www.baidu.com/s?wd=site%3A".$s; $site=file_get_contents($baidu); //$site=iconv("gb2312", "UTF-8", $site); ereg("找到相关网页(.*)篇,", $site,$count)

猜你喜欢

在Java类中灵活使用Static关键字

用专业术语来说,只有利用了new关键字创建对象后,才会在系统中为其创建存储空间.不过在有些特殊的情况下,程序员可能希望在没有创建对象的时候就能够为某个特定的成员分配存储空间或者可以调用某个方法等等.在 ...

利用ASP+XML打造个性化留言本(2)

六.建立写新留言程序(PostNew.asp) 这个文件要实现的功能就是写入新的XML节点,首先创建一个XML对像然后把XML读入内存中,利用appendChild()方法加入我们生成的XML节点. ...

领悟面向对象

"对象"以真实的事物(不是抽象概念或通俗比喻)为原型,通过封装与继承来解决事物规律(类)与真实应用(实例)中可能出现的差别,这就是把错综复杂的设命题变成整体打包的"封装& ...

PHP日常开发小技巧

PHP批量取得checkbox的值 1.命名 <input type='checkbox' name='checkbox[]' value=$dwmyrow[banzhu] /> 2.使用 ...

php的一个简单加密解密代码

分享一个php加密解密的类,在用户注册的时候发送邮件验证的时候估计会用的到的,代码如下代码如下: class SysCrypt{ private $crypt_key='http://ww ...

在Python中使用PIL模块对图片进行高斯模糊处理的教程

这篇文章主要介绍了在Python中使用PIL模块对图片进行高斯模糊处理的教程,这个无图形界面的脚本代码非常简单,需要的朋友可以参考下从一篇文章中看到,PIL 1.1.5 已经内置了高斯模糊,但是 ...

PS给人物减肥大变身

原图最终效果图 1.打开原图,进入通道面板,选择菜单图像计算,计算红色通道,保留人物见图. 2.新建背景层填色,剪切原图,并清理杂点. 原图分类: PS图片处理

win7蓝屏的原因分析及解决方法

蓝屏很多时候都是突然发生的,大多数是发生在你玩游戏的时候.很多时候是由于CPU一下子处理不过来,或者电脑脑脾气了.像中毒.中木马之类的蓝屏现在已经很好很好了,当然除非你的电脑是裸机,这才有可能. 1 ...

超个性明信片DIY 用好照片三步快速完成

旅行的路上,还在为给朋友带礼物而头疼吗?其实只要花了心思,礼轻也可情意重.一张明信片漂洋过海,或是翻山越岭到达朋友的手中,相比短信或者微博这样的社交网络,明信片让感情不再寄托在虚拟的网络环境里. 如果 ...

psp模拟器怎么用？

JPCSP是用于PC端的PSP游戏模拟器.JPCSP Ver 1.390 Extremum独家新版模拟器可以兼容直接引导普罗模块的游戏. ① 运行模拟器前必须安装最新的JAVA支持库: ② 建议安 ...

怎样解决Win8系统打开文件夹无响应的问题

对Win8系统充满了好奇,于是很多用户都下载安装了Win8系统,可是试用了一段时间之后,用户发现在Win8系统下总会出现这样或那样的小故障,其中打开文件夹经常显示未响应就是一种,用户遇到这样的问题要怎 ...

腾讯电脑管家扫一扫功能怎么用

"扫一扫"可以定期提醒您扫描和清理电脑垃圾.只要开启了"扫一扫"功能,它就会根据设置的频率,定期扫描电脑垃圾,并提示您进行清理.打开电脑管家主程序,点击&q ...

格式工厂怎么翻转视频

1.打开格式工厂程序 2.打开需要翻转的视频一. 3.角度偏左了,头不歪没法看那. 4.这个时候,我们用到格式工厂这个工具. 5.打开后,界面就是这个样子. 6.点击->MP4.弹出转换对话 ...

界面-新手求教initshellmanager()

问题描述新手求教initshellmanager() initshellmanager()不是系统函数,怎么调试的时候说它是未定义的标识符解决方案这个是VS2008SP1以后新家的CMFC控件库 ...

编程-我这个报了什么错？qt太难学了。

问题描述我这个报了什么错?qt太难学了. #include "mainwindow.h" #include "ui_mainwindow.h" #includ ...

一个IP只弹出一次代码

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅 <script> va ...

谷歌较劲阿里云：重新发明的轮子惹麻烦

9月17日凌晨消息,过去的四天时间里,谷歌和阿里云之间的较劲逐渐升温.双方的争论的焦点,看似是技术层面纠纷,实则在争夺产业未来.阿里云OS重新发明轮子式的自主研发,最终成为谷歌整顿Android产业的 ...

失败的网站赚钱反思得出的经验

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅记得我建的第一站点是在2005年吧 ...

2005年至今：房地产回归民生

在对房改10年反思之后,"保障性住房"被提到了前所未有的高度,"重市场轻保障"的住房模式正在面临根本性转变. 以增长来看中国房地产,则中国房地产的增长速度在相当 ...

超越摩尔定律为什么技术会不断发展？

相信大家都知道「摩尔定律」. 但是大家所知的摩尔定律仅仅指:在过去的50年里,集成电路上容纳的元器件数目保持指数级的增长,性能不断提升. 然而,你是否知道这种指数级的增长应用范围比你想象地更广.换句话 ...

python beautiful soup库的用法

参考:http://cuiqingcai.com/1319.html Beautiful Soup 4.2.0 文档 1. Beautiful Soup 简介简单来说,Beautiful Soup是 ...

asp.net 中静态方法和动态方法调用的区别实例分析_实用技巧

复制代码代码如下: //定义静态方法class SQLHelper { public static string aaa() { ret ...

《黑客秘笈——渗透测试实用指南》—第2章2.3节外部或内部的主动式信息收集

2.3 外部或内部的主动式信息收集黑客秘笈--渗透测试实用指南主动式信息收集就是通过主动扫描确认目标安装的操作系统和网络服务,并发现潜在漏洞的过程.即主动式信息收集必定对指定的网络段进行扫描.无论 ...

站长浅谈：如何注册一个好域名

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅初学者做站是从选域名开始的,这个观 ...

c-格式化C盘后怎样重装系统

问题描述格式化C盘后怎样重装系统我的C盘在开机后被格式化了,现在怎样才能重装系统?请说明详细步骤,越详细越好. 解决方案 http://www.jb51.net/os/60159.html 解决方 ...

介绍一款替代SSMS的sqlserver管理工具 toad for sqlserver5.7

原文:介绍一款替代SSMS的sqlserver管理工具 toad for sqlserver5.7 toad for sqlserver5.7 虽然SSMS很好很强大,不过有时候使用一些第三方工具可以 ...

东莞地沟油贩子加香精配成花生油3嫌疑人落网

"地沟油"加香精配成"花生油" 已售数百万元3名嫌疑人被批捕 (记者钟达文通讯员邓毅.陈汉文)又有一个地沟油贩子落网了.记者昨日从东莞市第一市区人民检察院获悉 ...

Xbox One国行版最新动态:将推出新游戏

人民网北京3月17日电 (记者沈光倩)微软中国的官方博客今日刊载了Xbox One国行版的最新动态. 微软 Xbox 事业部中国区总经理谢恩伟在博文中表示,在未来几周,微软将与百视通.百家合精诚合作, ...

jquery跨域请求示例分享(jquery发送ajax请求)_jquery

jQuery中常用getJSON来调用并获取远程的JSON字符串,将其转换为JSON对象,如果成功,则执行回调函数.原型如下: jQuery.getJSON( url, [data], [callba ...

python实现在无须过多援引的情况下创建字典的方法_python

本文实例讲述了python实现在无须过多援引的情况下创建字典的方法.分享给大家供大家参考.具体实现方法如下: 1.使用itertools模块 import itertools the_key = [' ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.026 s.