作业一(任选其一):
- 在你所在的公司(行业、领域),正在用大数据处理哪些业务?可以用大数据实现哪些价值?
公司所在的行业是医疗行业, 目前大数据应用的业务:
- 电子病历, 根据患者特征, 识别出某些重点关注的疾病案例, 实时预警, 监控, 预测, 并通过大屏展示数据
- 影像数据, 根据病变特性进行机器学习, 自动识别病变的案例
- 不良药物反应上报, 根据病历中的某些患者特征, 识别出是否药物过敏, 医疗器械应用, 化妆品反应等重点关注的案例, 然后自动上报到国家系统
- 疫情监控, 整合手机运行商轨迹数据, 预测被感染的几率
- 分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?
INSERT OVERWRITE TABLE pv_users
SELECT pv.pageid, u.age
FROM page_view pv
JOIN user u
ON (pv.userid = u.userid);
Page_view 表和 user 表结构与数据示例如下:
示意图如下: