第1节课
项目安排表 https://docs.qq.com/sheet/DWlpnZFVNanVGU2hH
- 至少确定方向:文本分析还是证券市场分析
- 评价各个小组的项目安排表
- PPT 项目分工和成员介绍
第2节课
方向:文本分析
- 运行人名识别示例
- 自己设计几个人名识别示例
- 思考: pseg.cut 返回的是什么类型?
- 思考:有些人名无法识别出来怎么办? 怎么把自己的名字添加到结巴词库的词典中
方向:证券市场分析
- 列出你了解的属性
- 阅读表格,思考你想获得哪些结果?
第3节课
方向:文本分析
- 选择3~5个候选分析的文本
- 实战中文文本中的关键字提取
方向:证券市场分析
- 按照地区分类,列出各个地区的上市公司数量
- 按照行业分类,列出各个行业的上市公司数量
第4节课
- 在知网搜索论文,知网网址: http://www.cnki.net/
- 论文搜索关键字: 词频分析 Jieba
- 每个小组从中国知网下载5篇相关论文
- 阅读:当小学生遇见苏轼 http://www.sohu.com/a/197924005_249860
选项可以选择:全文或关键词,下图使用的是关键词