成员:大数据201吴泽宇,计算机203江俊杰,大数据201吴沃洲

    • 作品说明:

    现如今,心血管疾病是全球的头号死因,每年死于心血管疾病的人数多于任何其它死因。

    • 2019 年估计有 1790 万人死于心血管疾病,占全球死亡总数的 32%,其中85% 是死于心脏病发作和中风
    • 超过四分之三的 CVD 死亡发生在低收入和中等收入国家。
    • 在 2019 年因非传染性疾病导致的 1700 万过早死亡(70 岁以下)中,38% 是由心血管疾病引起的。
    • 大多数心血管疾病可以通过烟草使用、不健康饮食和肥胖、缺乏身体活动和有害使用酒精等行为风险因素来预防。
    • 尽早发现心血管疾病很重要,这样才能开始通过咨询和药物进行管理。

    所以能够对心脏病的原因进行数据分析和可视化,挖掘出心脏病的重要原因,对现在十分关注健康的社会十分重要,因此,我们决定对心脏病数据集进行可视化。

    • 数据来源:

    本可视化数据集来源于kaggle数据集,该数据集是2020年CDC年度调查40万名成年人的健康状况相关数据集,该数据集包含心脏病这一健康指标,以供于医疗上的可视化与预测。
    该数据集有319795*18个数据集
    特征与标签: ‘HeartDisease’:心脏病,’BMI’:体重指数,’Smoking’:吸烟,’AlcoholDrinking’:酗酒,’Stroke’:中风,’PhysicalHealth’:身体健康,’MentalHealth’:心理健康,’DiffWalking’:艰难行走,’Sex’:性别,’AgeCategory’:年龄组成,’Race’:种族,’Diabetic’:糖尿病,’PhysicalActivity’:体力活动,’GenHealth’:基因健康,’SleepTime’:睡眠时间,’Asthma’:哮喘,’KidneyDisease’:肾病,’SkinCancer’:皮肤癌
    image.png

    • [x] 实验工具:
      基于python的数据分析包:numpy,seabon,pandas,matplotlib

    • [x] 实验过程

    1. 数据预处理:主要是将数据转为数值型。

    image.png
    image.png

    1. 全部数据分布的可视化:
      image.png

    2. 画出热力图,观察各个参数之间的相关性
      image.png
      从下图可以看出很多有趣的东西:

    1.心脏病和基因健康和年龄的相关性比较强
    2.艰难行走和身体健康也和基因健康有关
    3.年龄和皮肤病的患病率也有一定的相关性

    1. 对心脏病进行挖掘
      我们挑选出三个与心脏病最相关的参数进行可视化:DiffWalking,AgeCategory,GenHealth
      image.png
      从上面数图可以得出结论:

    1.行走不便的人中,患有心脏病的人的比例较多,说明行走不便的人较常人容易患上心脏病
    2.随着年龄的增长,人越容易患上心脏病
    **3.按比例来看,基因Fair和poor的人比较容易患上心脏病

    **

    1. 按照kaggle介绍,我们同时对身体健康比较重要的各项指标进行数据分析
      先从BMI入手:

    image.png** 1.通过图一可以看出,没有患糖尿病的人BMI比较低
    **2.通过图二可以看出,基因越健康的人它的BMI越低


    糖尿病:
    image.png
    通过该图可以看出:接近患上糖尿病的人,行走会比较不便


    行走不便:
    image.png
    **行走不便与基因也有较强的相关性


    皮肤病:
    image.png
    年龄越大,越容易患皮肤病


    睡眠时间:
    image.png
    睡眠时间普遍都在5-10个小时

    **

    • 可视化分析:

    通过对以上各种心脏病的有关因素数据的分析,以及数据的可视化图像,如柱状图、热力图、镶嵌图,可得到心脏病与基因健康、年龄的相关性强,且从可视化图像看出来,年龄和基因健康这两个因素与行走困难和皮肤病这类疾病也有联系。
    因此,我们从热力图挑选出与心脏病相关性强的几个参数进行更深一步的分析。通过对行走困难、年龄、基因健康的几个参数进行可视化,便可得到结论:

    • 行走不便的人中,心脏病患者占的比例较多。
    • 年龄越大的人越容易得心脏病、基因质量差的人也容易患上心脏病。

    除此外,我们也对其他与心脏病相关性较差的因素进行数据挖掘,如BMI,睡眠状态。

    最后,对心脏病的相关因素可视化之后,要降低心脏病的发病率,我们要早睡早起,保持身体健康,多运动,保持饮食健康。特别是我们现阶段的大学生,更是要注意自己的饮食和睡眠状态,对自己的健康负责。