包含如何在服务器上配置conda的词条
有鱼爱电影 2025-04-17 04:30 36 浏览 0 评论
阅读文本大概需要 2 分钟。
提示
以鄙人在GitHub上的辣鸡代码为例, 其他Scrapy的项目操作类似, 本文同样适用于不使用云服务器的情形(排除掉前期准备部分即可).
前期准备
(也可以到腾讯云开发者实验室体验)1. 购买云服务器
选择一家云服务厂商, 购买云服务器, 目前国内主流服务均有提供学生版
如果第一次购买, 可以戳这个链接
https://cloud.tencent.com/redirect.php?redirect=1010&cps_key=e042d9552c4c0be2cd377436ca42ee62
2. 下载Xshell, 使用ssh连接服务器
Xshell学生和家用是免费的, 下载地址https://www.netsarang.com/download/free_license.html
下载安装完成后,使用系统分配的公网IP, 系统用户名和对应密码连接服务器.
在Github上克隆代码
git clone https://github.com/FesonX/JobCrawler.git
安装相关依赖1. 安装Python3
项目使用Python3.6, 可以使用以下连接安装, 将文中的3.5改为3.6即可.
ubuntu14.04安装python3.5并且将其设置为python3默认启动
(https://blog.csdn.net/fireflychh/article/details/78195778)
2. 使用virtualenv(也可以使用Anaconda或Pycharm管理)
Virtualenv允许多版本Python同时在电脑上共存, 安装完Python3及pip后 终端键入
# 安装
pip3 install virtualenv
# 创建虚拟环境
virtualenv spider-env
# 激活虚拟环境
source spider-env/bin/activate
# 退出
deactivate
3. 安装库依赖
因为Scrapy依赖Python.h,在安装库依赖前在终端键入
sudo apt-get install libpython3.6-dev
然后安装依赖, 如果失败, 请逐条尝试
# 在JobCrawler/JobCrawler目录下
pip install -r requirements.txt
4. 安装MongoDB
参照以下连接安装 MongoDB Community Edition
(https://docs.mongodb.com/manual/administration/install-community/)
运行爬虫
终端cd到项目根目录, 键入
# -o job.csv为可选参数, 加入则输出到指定文件中
scrapy crawl jobCrawler -o job.csv
扩展: 使爬虫开机运行
使爬虫在系统开机时自动运行, 对于许多系统来说如何在服务器上配置conda,最简单 (如果不是最好的)的方式是使用rc.local文件 具体实现方式就交由如何在服务器上配置conda你自己用搜索引擎探索啦
欢迎点击查看原文关注如何在服务器上配置conda我的腾讯云社区账号
入门小白, 欢迎大家指出错误, 技术交流
QQ:994342122, Email: fesonx@foxmail.com
今日作者: 光光同学_
不爱看电影的摄影师不是好的程序员
- 上一篇:包含seo综合查询接口设计的词条
- 下一篇:关于苹果cms官网采集的信息
相关推荐
-
- 包含网站ipv6测速的词条
-
英文:ChristinaMercer网站ipv6测速,编译:开源中国 www.oschina.net/translate/best-open-source-network-monitoring-tools-2017 网络监控是企业...
-
2025-10-20 19:30 有鱼爱电影
-
- 域名备案查询工信部流程的简单介绍
-
随着互联网的飞速发展域名备案查询工信部流程,企业做网站的需求越来越大域名备案查询工信部流程,但是绝大多数的企业主对网站建设并不域名备案查询工信部流程了解,在寻找网站建设(www.jnqnweb.com)的公司时,并不会考虑太多,觉得只要...
-
2025-10-20 18:30 有鱼爱电影
-
- 网站设计流程图的简单介绍
-
今天这一节Tony老师就为大家整理网站设计流程图了一般上海网站建设公司建站流程的十二个步骤网站设计流程图,希望可以帮助到大家网站设计流程图! 第一步:与客户沟通建站意向需求 通过电话、邮件、在线QQ或面谈等方式了解客户需要网站建设的...
-
2025-10-20 17:30 有鱼爱电影
-
- 苹果cms模板文件不存在:index/index.html的简单介绍
-
苹果CMS源采集后图片不显示苹果cms模板文件不存在:index/index.html,可通过以下方法解决1基础文件修复若采集后图片路径异常或无法加载,可能是核心文件缺失导致下载tuphp文件需从官方或可靠渠道获取,将其上传至网站根目录与...
-
2025-10-20 15:30 有鱼爱电影
-
- 苹果cmsv10模板仿奈飞机 苹果cmsv10模板免费下载
-
硬朗强悍是军队在大家心中苹果cmsv10模板仿奈飞机的印象,也是这款马克十七腕表给我的第一印象,它的外观完美的契合它的定位,良好的阅读效果从外观和功能上都很符合飞行表的需求。 盘面设计延续了万国飞行员表的优秀设计,白色的阿拉伯数字具有...
-
2025-10-20 14:30 有鱼爱电影
-
- 关于服务器网盘搭建的信息
-
油库环境监测监控系统解决方案 一服务器网盘搭建:综述 目前,各加油站内油库存油量服务器网盘搭建的管理一般都是通过各加油站人工进行记录管理,上报各油站管理部门,基本上没有通过实时的信息管理监控系统进行辅助管理和集中统一管理,也没有将...
-
2025-10-20 07:30 有鱼爱电影
-
- 包含网站设计模板制作的词条
-
自学网页设计是一个什么概念网站设计模板制作,个人认为网页设计不是太难。但是,要是初入门的人可能就会找不到方向。本文主要为大家提供一个导向,避免大家走弯路。 一开始,能够告诉各位对网页设计有兴趣的朋友们。自学网页设计和自学其它学科...
-
2025-10-20 04:30 有鱼爱电影
-
- 关于域名申请ssl证书的信息
-
Let’sEncrypt免费SSL证书已经受到域名申请ssl证书了包括FireFox、Chrome在内的众多主流浏览器的兼容和支持,目前国内的应用主要是提现在各大电商网站和门户网站上,可以提高访问和交易安全性。很多外贸公司网站也使用是...
-
2025-10-20 02:30 有鱼爱电影
-
- 包含ip/域名查询的词条
-
ip/域名查询我们都知道域名是一个网站ip/域名查询的核心部位,一个好的域名对于网站的排名有着十分重要的促进作用。 很多人不知道域名的信息应该如何的查询,今天教大家查看域名的注册,域名备案信息。 一、首先,百度时代互联打开网址或者输...
-
2025-10-19 19:30 有鱼爱电影
-
- 阿里云申请域名的简单介绍
-
1.登录备案网站(https://beian.aliyun.com) 2.点击首次备案流程 3.点击“点击注册”进入到注册界面 4.填写正确有效阿里云申请域名的邮箱并设置密码。 5.进入填写的邮箱查看邮件,完成登录账户注册 6...
-
2025-10-19 16:30 有鱼爱电影
你 发表评论:
欢迎- 一周热门
-
-
复旦博士溺水身亡_复旦博士溺水身亡事件
-
DeepMind CEO:AGI将在未来5-10年内出现
-
美国和平研究所:政府效率部(DOGE)人员在联邦调查局特工陪同下试图进入该所,但被拒之门外
-
摩根士丹利基金投研手记:美债仍具配置价值
-
10元买彩票中5000万,唐山男子买彩票中5000万大奖,群里刷到中奖号码后才知大奖得主是自己,领完奖还不敢相信是真的,你怎么看?
-
北交所ETF将落地?业内寄望!
-
德意志银行:特朗普关税言论引发不确定性 美元汇率走低
-
俄乌停火协议“名存实亡”?双方互指违约,战俘交换成唯一亮点
-
中国奥园:预计2024年亏损不超过30亿元,同比大幅下降
-
在英国首相斯塔默与特朗普通话后,英国资产上涨
-
- 最近发表
- 最新留言
-
- 这篇文章真是让人受益匪浅!https://www.2kdy.com
- 楼上的这是啥态度呢?https://www.2kdy.com
- 楼主练了葵花宝典吧?https://www.2kdy.com
- 收藏了,改天让朋友看看!https://www.2kdy.com
- 每次看到楼主的帖子都有惊吓!https://www.2kdy.com
- 一口气看完了,我要下去回味回味了!https://www.2kdy.com
- 坚持回帖!https://www.2kdy.com
- 楼主很有经验啊!https://www.2kdy.com
- 太高深了,理解力不够用了!https://www.2kdy.com
- 刚分手,心情不好!https://www.2kdy.com