包含如何在服务器上配置conda的词条
有鱼爱电影 2025-04-17 04:30 20 浏览 0 评论
阅读文本大概需要 2 分钟。
提示
以鄙人在GitHub上的辣鸡代码为例, 其他Scrapy的项目操作类似, 本文同样适用于不使用云服务器的情形(排除掉前期准备部分即可).
前期准备
(也可以到腾讯云开发者实验室体验)1. 购买云服务器
选择一家云服务厂商, 购买云服务器, 目前国内主流服务均有提供学生版
如果第一次购买, 可以戳这个链接
https://cloud.tencent.com/redirect.php?redirect=1010&cps_key=e042d9552c4c0be2cd377436ca42ee62
2. 下载Xshell, 使用ssh连接服务器
Xshell学生和家用是免费的, 下载地址https://www.netsarang.com/download/free_license.html
下载安装完成后,使用系统分配的公网IP, 系统用户名和对应密码连接服务器.
在Github上克隆代码
git clone https://github.com/FesonX/JobCrawler.git
安装相关依赖1. 安装Python3
项目使用Python3.6, 可以使用以下连接安装, 将文中的3.5改为3.6即可.
ubuntu14.04安装python3.5并且将其设置为python3默认启动
(https://blog.csdn.net/fireflychh/article/details/78195778)
2. 使用virtualenv(也可以使用Anaconda或Pycharm管理)
Virtualenv允许多版本Python同时在电脑上共存, 安装完Python3及pip后 终端键入
# 安装
pip3 install virtualenv
# 创建虚拟环境
virtualenv spider-env
# 激活虚拟环境
source spider-env/bin/activate
# 退出
deactivate
3. 安装库依赖
因为Scrapy依赖Python.h,在安装库依赖前在终端键入
sudo apt-get install libpython3.6-dev
然后安装依赖, 如果失败, 请逐条尝试
# 在JobCrawler/JobCrawler目录下
pip install -r requirements.txt
4. 安装MongoDB
参照以下连接安装 MongoDB Community Edition
(https://docs.mongodb.com/manual/administration/install-community/)
运行爬虫
终端cd到项目根目录, 键入
# -o job.csv为可选参数, 加入则输出到指定文件中
scrapy crawl jobCrawler -o job.csv
扩展: 使爬虫开机运行
使爬虫在系统开机时自动运行, 对于许多系统来说如何在服务器上配置conda,最简单 (如果不是最好的)的方式是使用rc.local文件 具体实现方式就交由如何在服务器上配置conda你自己用搜索引擎探索啦
欢迎点击查看原文关注如何在服务器上配置conda我的腾讯云社区账号
入门小白, 欢迎大家指出错误, 技术交流
QQ:994342122, Email: fesonx@foxmail.com
今日作者: 光光同学_
不爱看电影的摄影师不是好的程序员
- 上一篇:包含seo综合查询接口设计的词条
- 下一篇:关于苹果cms官网采集的信息
相关推荐
-
- seo是什么岗位的简单介绍
-
现在是互联网时代seo是什么岗位,各行各业都想在网络上占有自己的一定市场,那么想占据互联网的市场,首先就要在网络上能够让网民看到信息。这时候是需要一个网站来作为载体,让用户能够在互联网上找到自己的网站。那么seo就业前景怎么样呢seo是...
-
2025-07-03 08:30 有鱼爱电影
-
- 包含服务器繁忙请稍后再试微信的词条
-
炎炎夏日已经进入服务器繁忙请稍后再试微信了高潮阶段,全国部分地区的最高气温也已经达到了40度左右。夏日正午被阳光灼热的车辆,座椅一定很烫,如果您的爱车配备的是皮质座椅,您一定不要着急坐上去,因为严重的话有可能会被烫伤。这种情况下怎样解决...
-
2025-07-03 06:30 有鱼爱电影
-
- 苹果cms插件怎么添加图层 cad最好用的免费插件
-
最终效果 1、我们先得在网上找到合适苹果cms插件怎么添加图层的图片苹果cms插件怎么添加图层,最好找一张背景比较干净且背景颜色浅的图片,这样就省去了我们抠图的步骤,我找的就是下面一张图。 2、复制一层图片,使...
-
2025-07-03 05:30 有鱼爱电影
-
- 包含苹果cms官方资源采集站官网的词条
-
天然蜜就是蜜蜂采集花蜜酿造而成苹果cms官方资源采集站官网的。它们来源于植物的花内蜜腺或在外蜜腺苹果cms官方资源采集站官网,通常苹果cms官方资源采集站官网我们所说的蜂蜜就是天然蜜,又因来源于不同的蜜源植物,又分为某一植物花期为主体的...
-
2025-07-03 03:30 有鱼爱电影
-
- 关于域名是什么?的信息
-
企业网站建设中域名是什么?,网站域名是必不可少域名是什么?的组成部分。域名相当与网站在互联网上的名字域名是什么?,那么域名是什么?,域名主要有什么作用呢?下面我们来简单分析一下。 1.节省广告推广开销 如果域名较长,不好记,每次都让...
-
2025-07-03 02:30 有鱼爱电影
-
- 能效网站备案查询网站的简单介绍
-
评估报告共三册 本册为第二(8)册 浙江英特集团股份有限公司拟向 浙江华资实业发展有限公司和浙江华辰投资发展有限公司 定向发行股票购买该二公司持有 浙江英特药业有限责任公司...
-
2025-07-02 19:30 有鱼爱电影
-
- 关于网站模板下载免费wordpress的信息
-
在数字媒体时代网站模板下载免费wordpress,短视频成为网站模板下载免费wordpress了传播信息、表达创意的重要形式。而对于短视频创作者来说网站模板下载免费wordpress,找到合适的视频素材是创作成功的关键。那么网站模板下载免费...
-
2025-07-02 17:30 有鱼爱电影
-
- 关于什么是seo写出seo的定义、全称和作用的信息
-
搜索引擎优化不是大家想的那么简单什么是seo写出seo的定义、全称和作用,想学到技术还是要自己领悟,自己用心,自己实践。在这里和大家分享SEO学习的几个点,和大家共同探讨 (1)原创内容说简单也不简单 内容是网站的核心,原创的有吸引...
-
2025-07-02 13:30 有鱼爱电影
-
- 域名备案要多久的简单介绍
-
启道北大考研复试辅导班-北大心理学系考研招生简章、专业目录、参考书、经验分享、复试名单、报录比、分数线 北大心理学系考研招生简章 一、推荐免试 按照教育部研究生招生工作的有关规定域名备案要多久,北京大学通过推荐免试方式接收全国重点...
-
2025-07-02 06:30 有鱼爱电影
-
- 关于腾讯云wordpress建站教程filetypepdf的信息
-
很多上班族由于自身工资不是很高腾讯云wordpress建站教程filetypepdf,所以都利用上班做兼职赚钱,但是又不知道上班族兼职做什么好 ,这里小编告诉大家,上班族兼职做什么好,上班族兼职有哪些好腾讯云wordpress建站教程f...
-
2025-07-02 05:30 有鱼爱电影
你 发表评论:
欢迎- 一周热门
- 最近发表
- 最新留言