专业财税服务推荐

精选优质财税服务,为企业提供专业、可靠的财税解决方案,助力企业健康发展

零报税代理记账
零申报代理记账
报税做账算帐财务报表老会计做账
代理记账
咨询微信:lhy_happyday
工商营业执照年度年报年检公示
全国个体、企业、公司、合作社工商年审年报服务!
个体/10元/次 企业/20元/次
咨询微信:lhy_happyday
财税咨询服务
一对一专业财税咨询,解决企业财税难题,提供定制方案
咨询微信:lhy_happyday
财务分析服务
小规模个体报税0申报税务年报工商年报月报季报报税代理记账
咨询微信:lhy_happyday
立即咨询专业财税顾问
微信号: lhy_happyday
会计从业9年,管理多家个体工商、小规模、一般纳税人等企业的财务、税务等相关工作!。
扫码或搜索添加微信,备注"财税咨询"获取专属优惠
知方号 知方号

爬虫出现空列表或者长度为0是怎么回事? 爬虫失败的原因是什么

爬虫出现空列表或者长度为0是怎么回事?

 今天来总结一下在爬虫遇到的特殊情况,利用正则或者xpath来匹配提取数据,偶尔会发现可以找到这个对象,却无法提取它的下一阶层的数据,这是怎么一回事?

自己分析结果有以下几种:

(1)自己的匹配写错了,怎么可能,我再三检查,对的不能再对了,排除这种情况,毕竟是本宝宝写的,谁还没有点小自信了。

(2)可能是User-Agent浏览器版本不兼容,遇到这种情况要注意了,先检查一下自己爬取的数据,看看是不是被注释了,这是一种简单反爬技术,哼,这能难倒我?天真!解决办法:1去掉User-Agent2更换IE的User-Agent,可惜我还是没能解决,那么就只能是第三种情况了

第二种情况如下:

 

(3)百度个小婊砸,居然把我想要爬取的数据的div隐藏了:

 

在浏览器检查元素,可以清楚的看到自己想要爬取的数据,就在那就在那,看的见摸不着,再看看自己爬下来的数据,居然变成空的了,哼,今天本宝宝铁了心也要爬下来,我直接复制网页源代码还不行吗?

万万想不到啊,道高一尺魔高一丈,跟百度斗,果然我还是嫩啊,网页源代码下载下来居然还是空的,我的心情真是草泥马了,没办法,滋滋滋,再强大的网站也抵挡不了一下誓死要爬取的心,解决如下:

哎,主要自己太菜了,只能将要爬取的内容复制下来,然后提取,这真是一次失败的爬虫经历 !呜呜呜

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至lizi9903@foxmail.com举报,一经查实,本站将立刻删除。