Task01:基于逻辑回归的分类预测(2天)

    打卡截止:08月20日 23:59

    天池链接:https://developer.aliyun.com/ai/scenario/9ad3416619b1423180f656d1c9ae44f7

    打卡链接:https://shimo.im/forms/KRprat8nJyAETmPU/fill

    打卡结果:https://shimo.im/sheets/L9kBMPRZXZFPNLqK/MODOC/




    于 2020/8/20 11:15 开始

    • 读下作业题目

    image.png

    逻辑回归的应用场景,目前还看不太懂
    是一个理解数据的好工具,可以看出特征对结果的影响

    可以看到这个教程先实践代码,再讲原理的
    image.png


    • 复习下之前看过的的李宏毅逻辑回归笔记

    之前的遗留问题:

    image.png

    12:07 暂停

    • 熟悉环境

    现在是下午四点二十九分

    • 实践
    • 带注释

    第一遍就先跟着注释,手把手的操作一遍。
    image.png

    image.png

    image.png

    image.png



    image.png

    image.png

    这里面给的例子可以先拷贝过去执行一下,看下效果。然后最好自己在手工的敲一遍。目的是把中间每一步都过一下,有没有不理解的。



    image.png

    image.png

    image.png

    image.png

    image.png

    image.png

    以上都是对现有数据的一些观察。绘图。

    image.png
    然后同样用sk learn的logistic regression。这个方法去训练。一个模型。这块对于模型的参数有了一些调整。

    image.png


    用了几种方法来检验一下测试的准确程度。一个是用accurancy这个方法。方法还有一个用混淆矩阵加热力图的方式。
    image.png

    image.png

    • 不带注释,自己在本地环境里实现一边例程
    • [x] 看课件里的理论解释



      问题记录:
      1、为什么?有些基本的。numpy的用法。还是要在熟悉一下。
      image.png


      image.png
      https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.c_.html

      2、需要再根据LogisticsRegression的文档理解下这里的参数的含义

      image.png
      那么这里的solver看起来像是一个优化函数的参数。那么问题就来了,什么时候要用lbfs?什么时候要用其他的

      image.png
      在这一步为什么要查看w和w0?能得出一些可直观理解的信息么?
      3、如何看某个特征对决测结果的影响?


      总结:
      1、用sklearn自带的LogisticsRegression训练一个分类模型
      2、可以用混淆矩阵来查看测试的准确程度。
      3、用seaborn、matplotlib做数据可视化
      数据可视化:
      scatter的用法
      contour 如何用等高线来画决策边界
      seaborn基本用法
      3d散点图