Skip to content

yankwan/node-spider

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

node-spider

基于nodejs的一个简单爬虫,爬取豆瓣电影分类下的电影列表,本例爬取的是动画分类下的电影列表

可以根据需要在配置文件中替换爬取的分类信息,豆瓣分类信息: https://movie.douban.com/tag/

使用

git clone https://github.com/yankwan/node-spider.git
cd node-spider
npm install
node spider.js

配置

config.js中配置了简单的基本信息,根据需要修改

var config = {
    // 并发控制数量
    concurrency : 5,

    // 爬取网页数量(分页数目)
    fetchPages : 10,

    // 爬取电影分类
    fetchCategory : "动画",

    // 设置延时, 每隔一段时间爬取一次
    delay : 1000

}

About

nodejs实现简单爬虫爬取douban

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published