谁可以帮帮我把这个代码调通~!感谢

问题描述

import urllib2from BeautifulSoup import BeautifulSoup,Tagimport reimport osimport staturl_str="http://ispo-mediaservices.com/prj_152/customer/"headers = {"User-Agent":"Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)"}req =urllib2.Request(url_str,headers=headers)page=urllib2.urlopen(req)soup = BeautifulSoup(page,fromEncoding="utf8")#print unicode(soup.findAll("table")[4])kk=soup.html.head.titleprint kkURL不要换(URL换成http://www.google.com能调通) 谢谢 请赐教 问题补充:iihero 写道

解决方案

我用的python 2.7.1,beautifulsoup版本是3.2.0-1,运行结果正常,不是代码的问题,可能是beautifulsoup的问题,如果你用的是3.1.X版本,你试一下3.2.X的结果怎么样;若还不行,你就把python换成2.6,beautifulsoup换成3.0.X,因为beautifulsoup从3.1.X开始内部的对HTML的解析由原来的SGMLParser换为HTMLParser,后者对结构不好的文档会发生“malformed start tag”类似的错误,具体可见:http://www.crummy.com/software/BeautifulSoup/3.1-problems.html
解决方案二:
引用page=urllib2.urlopen(req) 换成Python代码 收藏代码 1. page=urllib2.urlopen(req).read(1024) page=urllib2.urlopen(req).read(1024)就能执行成功返回 <title>ispo media services - boost your business</title>.read(1024) 是不是限定读取大小的? 1024是个什么单位 你知道么?会不会是因为这个网页以及http://www.163.com 这些网页 html太大,所以存储空间不够才报错的?这个存储空间是占用的哪里的 会不会因为你那里这个空间足够大 所以直接执行就成功了?你也帮我分析分析原因 谢谢呀 .read(1024),读取前1024个字节.我觉得不是内存的原因,反而更像是网络原因,比如多长时间超时之内的,如果超时,返回的结果有可能不是标准的html页面,导致你的beautifulsoap解析不了。你可以直接在:page=urllib2.urlopen(req)后边加一行print page.read()把页面的内容打出来看看,是不是标准的html页面。
解决方案三:
引用对了请问你是 linux环境还是windows环境呢?我是在windows下运行的。
解决方案四:
打不开页面,那肯定会出错啊。
解决方案五:
奇怪了,这样,你把http://ispo-mediaservices.com/prj_152/customer/ 这个页面的结果(纯文本)弄出来看看,有可能是结果就是不对。
解决方案六:
估计是跟python版本有关,你要不,降到2.5.x试试吧。
解决方案七:
你的代码挺好的,我这里可以直接运行:http://ispo-mediaservices.com/prj_152/customer/结果:<title>ispo media services - boost your business</title>我用的是:BeautifulSoup-3.0.1.pypython2.5.2

时间: 2024-11-05 04:53:06

谁可以帮帮我把这个代码调通~!感谢的相关文章

c语言-求大神帮帮看看这段代码那里出错了。谢谢

问题描述 求大神帮帮看看这段代码那里出错了.谢谢 刚刚学习,什么都不懂,今天第一次练手,却出现错误,我看了半小时楞是没看出来哪里出错了,求大家帮帮看看.谢谢了. 解决方案 要使用system()函数,就得加头文件,注意你源代码文件保存的后缀名为.c文件,main()函数下面的第一行有个分号 ; 解决方案二: 第一行system那行,最后加分号 解决方案三: [VB.NET]大家看看,这段代码出错了,要怎么改,谢谢,,在线等,当天结贴!!!!!! 解决方案四: system("color 5&qu

2016最后一贴,终于调通一个测试示例,并发现一个BUG???

真的难点在于第一次调通.纠结五天,终于搞出界面. 也发现了一个书上代码,编辑用户时死活不通的情况,我将Links去了,改在data里,我X,,全OK了.. 原来的代码: onAdd: function(button, e, options){ this.createDialog(null); }, onEdit: function(button, e, options){ var me = this, records = me.getRecordsSelected(); if(records[0

pdf-求Linux下office文件转换PDF的最适合方法,急!最好有代码!万分感谢!

问题描述 求Linux下office文件转换PDF的最适合方法,急!最好有代码!万分感谢! 客户提了个无比奇葩的要求,需要既生成word又生成PDF,还要内容一致,奇葩的项目经理还硬是同意了这个需求,然后开发的俺,作为一个新手,遭殃了! 换了很多种方法,在Windows下都成功了,但是很多都不适合用于Linux下. 好不容易觉得openoffice可以了,但是又遇到了各种奇葩的问题,导致openoffice根本启动不了,查找了网上相关的命令启动,报错需要一个桌面什么的.... 这个问题难道这么多

esper计算问题,有会的大神麻烦贴下代码,非常感谢

问题描述 esper计算问题,有会的大神麻烦贴下代码,非常感谢 1.字段是sbn,me,NodeB,cellID,都是int类型,time是long类型 2.100个计数器,分别是C1-C100,其中C1-C50是求sum,C51-C80是求avg,C81-C90是求max,C91-C100是求min 3.sendEvent(),发送事件1W条 4.汇总,time_batch(1 min) 5.updateListener 输出 实体类: @Data @NoArgsConstructor @Al

c语言-C代码帮看下思想,最好能写出Java代码,非常感谢

问题描述 C代码帮看下思想,最好能写出Java代码,非常感谢 2.*?slideing?block?chunking,?performance?is?a?big?issue?due?to?too?many?hash?lookup.? 3.?*/?? 4.static?int?file_chunk_sb(int?fd,?int?fd_ldata,?int?fd_bdata,?unsigned?int?*pos,?unsigned?int?*block_num,?? 5.?????????block

请高人帮我分析一下这段代码,万分感谢!

问题描述 请高手帮我详细解释一下这段代码,万分感谢!尤其是红色部分.///<summary>///创建一个SqlCommand对象以此来执行存储过程///</summary>///<paramname="procName">存储过程的名称</param>///<paramname="prams">存储过程所需参数</param>///<returns>返回SqlCommand对象&l

大神们能帮帮我分析下代码有什么问题么???

问题描述 这段代码是获取datagridveiw的一行一列的值,然后根据这个值删除数据,操作数据库的,但是现在问题是,这段代码的效果是必须连着点击两次按钮才能删除,真奇怪啊~~~~ 解决方案 解决方案二:你是不是用的列表双击事件?用click事件就可以了你贴代码怎么把图片弄上来了?解决方案三:引用楼主的回复: 这段代码是获取datagridveiw的一行一列的值,然后根据这个值删除数据,操作数据库的,但是现在问题是,这段代码的效果是必须连着点击两次按钮才能删除,真奇怪啊~~~~ 在dgv的Cel

短信平台PHP代码一点通

近段时间接触短信平台机会比较多,想想好像客户方面的短信平台就是用PHP做出来的,心痒痒便找了一下资料学习一下,代码如下: <?PHP   $flag = 0;          //要post的数据  $argv = array(                   'sn'=>'SDK-BBX-010-XXXXX',     'pwd'=>'XXXXXX',     'mobile'=>'134338XXXXX', //测试的手机号                  'conte

调通SELINUX下的VSFTPD

由于版本比较新,很多参数和以前找到的方案不一样了... 客户端我喜欢用FILEZILLA,显得比较尊重版权啦...