项目作者: li-fengjie

项目描述 :
基于数据分析的关键词分析系统 javaweb
高级语言: JavaScript
项目地址: git://github.com/li-fengjie/keyword.git
创建时间: 2020-01-14T10:58:12Z
项目社区:https://github.com/li-fengjie/keyword

开源协议:

下载


关键词分析统计使用说明

  1. i. 所用技术
  2. 1) Java后台开发
  3. 2) 前端UI框架的应用
  4. 3) servletc3p0连接池、MySQL数据库的应用
  5. 4) TextRank4Keyword 自然语言处理关键词提取
  6. 5) ThreadPool 线程池
  7. 6) jsonp 爬虫
  8. 7) Mail IMAP协议
  9. 8pdfbox PDF2String
  10. 9poi 生成excel
  11. ii. 实现功能
  12. 1) Java爬虫拉取雪球网40万+条公司年报PDF文件数据
  13. 2) PDF文件转文本并分析所属公司
  14. 3) 指定关键词的类型指标分类统计
  15. 4) 统计结果的报表生成
  16. 5)向用户发送报表邮件

一、添加关心的公司

添加公司

在分析前首先要做的工作就是添加需要分析统计的公司:

  1. 点击公司管理
  2. 点击添加公司
  3. 输入公司的行业名称(可为空)、公司名称(可为空)、股票代码(不为空)、股票名称(不为空)
  4. 点击提交即可完成添加

公司列表说明:

公司列表

2

  1. 下拉分页
  2. 表示正在加载数据,如果数据过多可能会需要较长时间
  3. 点击ID等表头可以进行排序
  4. 从数据中检索
  5. 点击编辑本条记录
  6. 点击启用分析本条数据
  7. 点击删除本条数据
  8. 表示本条数据已被禁用

3165个关心的公司已初始化到数据库

二、上传需分析的pdf文档

上传pdf文档

  1. 点击上传文档
  2. 选择文档所属公司(默认自动检测文档所属公司)
  3. 是否自动检测文档所属公司
  4. 点击选择文档或将pdf文档到此区域

文档上传

  1. 取消上传该文档
  2. 点击开始上传
  3. 点击继续添加

三、添加类型指标

添加

  1. 关键词管理→类型指标
  2. 添加类型指标
  3. 点击类型指标名称可以跳转到该类型指标下的关键词管理

四、添加关键词

添加关键词

添加关键词

  1. 关键词列表
  2. 在该类型指标下添加关键词

五、添加邮箱信息

添加邮箱信息

  1. 点击系统管理→系统设置
  2. 填写SMTP服务器
  3. 服务器邮箱账号
  4. 邮箱密码
  5. 收件邮箱地址
  6. 点击保存

:邮箱信息是在分析结束后,服务会将分析报表以邮件的形式发送到目标邮件地址。以上2、3、4为服务器邮箱配置,5为目标邮箱。

另:

(1)文件管理

文件列表

因为文件数量庞大,响应时间可能会很长,可在数据查看。

(2)数据规模

pdf文档

数据库

222G+的pdf文档,3165个公司, 40万+条数据,爬了我两天两夜~ ~

分析样例

分析结果报表

项目立项




新闻报道