课堂测验

1、题目Python基础:求200-300之间不能被3整除,但能被7整除的数之和
image.png
2.1、有字符串:
s = “where there is a will there is a way”
要求统计字符串s中所有字母出现的次数,并按出现次数的多少降序排序输出,若次数一样则按字母顺序排序输出。
image.png
3、题目SparkRDD:下载并统计下列文件中单词的出现频率大于等于5的单词及其频率
image.png
4、题目SparkStreaming:实时统计统计接收到的单词数 要求:
要求监听本机20200端口的通讯数据
要求批处理时间间隔为10秒
使用netcat发送通讯数据,数据单词使用空格分割
显示统计结果
image.png
image.png
image.png
5、泰坦尼克号数据集提供了泰坦尼克号撞击冰山并沉没时船上 2201 人中每个人的四个分类属性的值。属性是:社会等级(头等舱1、二等舱2、三等舱3、船员0)、年龄(成人1或儿童0)、性别(男1或女0)、幸存(是1或否0)四个。这个自然数据集感兴趣的问题是生存与其他属性的关系。要求:

  1. 读取泰坦尼克号数据集
  2. 设置列明为社会等级class,年龄age,性别sex,是否幸存survived
  3. 查看头等舱人数
  4. 分别查看幸存的儿童与成人人数
  5. image.png