项目作者: tsetsugekka

项目描述 :
爬虫exe化案例/スクレピングスクリプトのexe化(2021年7月)
高级语言: Jupyter Notebook
项目地址: git://github.com/tsetsugekka/Scraping_Tool.git
创建时间: 2021-07-08T22:03:52Z
项目社区:https://github.com/tsetsugekka/Scraping_Tool

开源协议:

下载


ScrapingTool

/g/personal/tong_primal-biz_co_jp/EhQB_6vsUwJGg79W6IJQs2oBi9UevrEapN_VLNUQ6B-MBA?e=GxoZrg">exe版下载

项目概要

  • GREENJAPAN

    从求职网站(GREENJAPAN)搜索与某一关键词相关的企业,并输出成企业列表

已知的问题

  1. resource_path在jupyter执行报错,在jupyter执行脚本时需要不启用resource_path。
  2. 打包exe后chromium无法被调用。这里用了以文件夹形式打包(参数-D),打包后手动将chromium复制到打包后文件夹的方式解决。
  3. 提示缺少openpyxls库,按这里的方法解决了。

requirements.txt

  • pandas==0.24.2
  • selenium==3.141.0
  • chromedriver_binary==83.0.4103.39.0

pyinstaller语句

pyinstaller ./20210709_ScrapingScript_GreenJapan.py -D --clean -n "ScrapingTool" -i fav.ico --add-binary "./driver/chromedriver.exe;./driver" --add-binary "./browser;./browser"

参考资料