pythonspider
CtrlK
  • Introduction
  • 1.准备工作
    • 1.1 常见的三种数据库的安装配置
    • 1.2 Python常用库的安装
    • 1.3 使用Python的正则表达式过滤字符串
    • 1.4 理解Python中使用yield进行迭代
    • 1.5 Mysql基础知识
    • 1.6 MongoDB基础知识
  • 2.爬虫基本流程
    • 2.1 Python使用Urllib库爬取数据
    • 2.2 Python使用Requests库爬取数据
    • 2.3 使用Requests和正则表达式爬取猫眼电影Top 100排行榜
    • 2.4 使用Python的解析库爬取Web数据
    • 2.5 使用Requests和PyQuery爬取猫眼电影Top 100排行榜
  • 3.保存爬虫数据
    • 3.1 保存爬虫数据至Txt文本
    • 3.2 保存爬虫数据至Json
    • 3.3 保存爬虫数据至Excel
    • 3.4 Python操作Mysql
    • 3.5 Python操作MongoDB
    • 3.6 Python操作Redis
  • 4.爬取Ajax数据
    • 4.1 爬取罗永浩微博
Powered by GitBook
On this page

1.准备工作

开始爬虫前的准备工作,包括:

  1. 数据库的安装配置

  2. Python常见库的安装

  3. Python正则表达式的理解

  4. Python中yield的理解

  5. Mysql基础知识

  6. MongoDB基础知识

PreviousIntroductionNext1.1 常见的三种数据库的安装配置

Last updated 7 years ago