作业一(任选其一):

  • 在你所在的公司(行业、领域),正在用大数据处理哪些业务?可以用大数据实现哪些价值?

公司所在的行业是医疗行业, 目前大数据应用的业务:

  • 电子病历, 根据患者特征, 识别出某些重点关注的疾病案例, 实时预警, 监控, 预测, 并通过大屏展示数据
  • 影像数据, 根据病变特性进行机器学习, 自动识别病变的案例
  • 不良药物反应上报, 根据病历中的某些患者特征, 识别出是否药物过敏, 医疗器械应用, 化妆品反应等重点关注的案例, 然后自动上报到国家系统
  • 疫情监控, 整合手机运行商轨迹数据, 预测被感染的几率
  • 分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?
  1. INSERT OVERWRITE TABLE pv_users
  2. SELECT pv.pageid, u.age
  3. FROM page_view pv
  4. JOIN user u
  5. ON (pv.userid = u.userid);

Page_view 表和 user 表结构与数据示例如下:
作业-week12 - 图1

示意图如下:

image.pngimage.png