前排提醒:题目及答案为DBE内提供,但在实际考试时答案貌似不符,建议将答案在网络再查询一遍,确认正确性。
- 1.
最早提出“大数据”时代已经到来的机构是( )(单选题)
A.IBM B.中兴新云 C.麦肯锡 D.联想集团 - 2.
大数据的特征有哪些( )(多选题)
A.Volume B.Velocity C.Variety D.Value E.Veracity - 3.
大数据包含如下类别( )(多选题)
A.结构化数据 B.非结构化数据 C.半结构化数据 D.类结构化数据 4.
非结构化数据是指其字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成的数据库,包括数字、符号等。(判断题)
对错1.
Python的优点包括以下哪些选项( )(多选题)
A.简单易学,语法优美 B.开发效率高 C.应用领域广泛 D.可移植性好 E.可扩展性高- 2.
Python的缺点有哪些( )(多选题)
A.运行速度慢 B.Python的GIL锁限制并发 C.Python2.X和Python3.X不能完全兼容 D.Python2.X和Python3.X的库非常少 3.
Python的缩进通常使用( )(单选题)
A.2个space(空格) B.1个tab C.4个space(空格) D.2个tab1.
以下哪种数据形式是半结构化数据( )(单选题)
A.SQL B.表格 C.HTML D.图片2.
上交所XBRL财报页面的Python采集脚本里,‘code=[ ]’的方括号里定义的数据是企业的证券交易代码等信息。(判断题)
对 错1.
以下哪些内容是常见的数据清洗问题(多选题)
A.数值为空,有缺失 B.有影响指标计算的非法字符,如英文逗号、空格等 C.重复数据 D.日期、时间格式不一致- 2.
数据清洗一般遵循以下哪些原则(多选题)
A.每份数据连入时都针对这份数据清洗,清洗干净后再做数据合并、联接 B.数据量小的数据连入时,先合并、联接数据后再清洗
C.在大规模数据计算前,先执行数据清洗 D.数据清洗结果有问题时,从数据源头开始检查数据质量问题
3.
在案例数据集中可以使用清除所有空格的全局清洗规则(判断题)
对 错1.
公司现有两张财务报表,一份是当月的利润明细表,一份是公司在售产品清单表,现在想分析各产品的利润情况,需要对这两表做哪种数据集成?(单选题)
A.数据关联 B.数据合并 C.数据追加 D.数据联动- 2.
在大数据分析时,例如资产负债表、利润表这样的财报数据表属于(单选题)
A.维度表 B.事实表 3.
只显示满足关联条件的左右两表的数据记录,不符合的条件的数据不使用。这种连接方式为( )(单选题)
A.内连接 B.全连接 C.左连接 D.右连接1.
下列属于盈利能力指标是( )(多选题)
A.营业利润率 B.总资产增长率 C.净资产收益率 D.总资产净利率- 2.
总资产净利率越高,表明企业资产的利用效果越好。企业可以通过提高营业净利率、加速资产周转来提高总资产净利率(判断题)
对 错