python3.4学习笔记(十七) 网络爬虫使用Beautifulsoup4抓取内容
Beautiful Soup 是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树(parse tree)。 它提供简单又常用的导航(navigating),搜索以及修改剖析树的操作。它可以大大节省你的编程时间。
Beautiful Soup Documentation — Beautiful Soup 4.4.0 documentationhttp://www.crummy.com/software/BeautifulSoup/bs4/doc/
[学习]用python的BeautifulSoup分析html - 三夜灯 - 博客园http://www.cnblogs.com/twinsclover/archive/2012/04/26/2471704.html
Beautiful3 Soup documentation 中文文档只有bs3的,最新的只有英文版的http://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.html#Quick%20Start
热血狂徒 / zyspider - 代码托管 - 开源中国社区http://git.oschina.net/coos/zyspider
python3.4学习笔记(十三) 网络爬虫实例代码,使用pyspider抓取多牛投资吧里面的文章信息,抓取政府网新闻内容 - 流风,飘然的风 - 博客园http://www.cnblogs.com/zdz8207/p/python_learn_note_13.html
============================================BeautifulSoup4的安装
一、使用pip直接安装beautifulsoup4 (如何安装pip请看