L02 Machine Learning Overview

PDF.74
L02 機器學習 - 图1

機器學習算法總覽

image.png

Machine Learning Process

L02 機器學習 - 图3

Quiz L02 Machine Learning

English Quiz

10分(计分)
1. (True or false) Gradient descent iteration is the only method of machine learning algorithms.
true
ANSWER false
未答复

  1. (Single-answer question) Which of the following algorithms is not supervised learning?
    Linear regression
    Decision tree
    KNN
    ANSWER K-means

测一测

11分(计分)
1.(判断)机器学习是研究“学习算法”的一门学问。
ANSWER true
false
未答复

2.(单选)对于复杂的规模大的问题,应该用()方法解决?
基于规则的方法
ANSWER 机器学习算法
函数法
未答复

3.(判断)机器学习可以分为有监督、无监督、半监督和强化学习4类。
ANSWER true
false
未答复

4.(判断)强化学习的教师信号就是标签。
true
false
未答复

:::info

强化学习 Reinforcement Learning PDF.92

模型感知环境,做出行动,根据状态与奖惩做出调整和选择。

强化学习总是在寻找什么样 的行动才是最佳的?
强化学习针对的对 象是机器或者机器人。 
自动驾驶汽车:黄灯开始闪了,是刹车还是 加速通过? 
对于一个吸尘机器人,是继续吸尘还是回去 充电? :::

5.(多选)数据集可以被分为以下哪些集合?
ANSWER 训练集
ANSWER 测试集
ANSWER 验证集
未答复

6.(判断)训练集和测试集不可以有交集。
ANSWER true
false
未答复

  1. (判断)泛化能力是判断一个模型好坏的重要标准。
    ANSWER true
    false
    未答复

8.(多选)模型误差可能来源于以下哪几类?
ANSWER 方差
ANSWER 偏差
ANSWER 不可消解误差
未答复

9.(多选)以下是梯度下降法的是()?
ANSWER 批量梯度下降
ANSWER 小批量梯度下降
大批量梯度下降
ANSWER 随机批量梯度下降
未答复

10.(判断)参数与超参数都可以通过模型自己学习获得。
true
false
未答复 :::info

模型中的参数与超参数 PDF.124

模型中不但有参数,还有超参数的存在。其目的是为了让模型能够学习到最佳的参数

  • 参数有模型自动学习
  • 超参数由人工手动设定 :::
  1. (判断)线性回归做分类,逻辑回归做回归。
    true
    ANSWER false
    未答复

12.(单选)下列不属于决策树类型的是()?
ID3
RIDGE (模型超參數)
C4.5
未答复 :::info

決策樹 PDF.142

决策树:决策树(decision tree)是一个树结构(可以是二叉树或非二叉树)。
其每个非叶节点表示 一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类 别。使用决策树进行决策的过程就是从根节点开始,测试待分类项中相应的特征属性,并按照其值选 择输出分支,直到到达叶子节点,将叶子节点存放的类别作为决策结果。
常见的决策树算法有ID3,C4.5,CART等。 :::

13.(判断)SVM算法可以做回归。
ANSWER true
false
未答复

14.(单选)K-means 算法属于()算法?
有监督
ANSWER 无监督
强化学习
半监督
未答复

15.(单选)线性回归迭代学习是为了学习()?
参数x
参数w
超参数
未答复

:::info

線性回歸 PDF.133

线性回归(Linear regression):线性回归是利用数理统计中回归分析,来确定两 种或两种以上变量间相互依赖的定量关系的一种统计分析方法。 
线性回归是一种有监督学习。
我们想要预测值与真实值最接近,就是求损失值最小。
可以使用梯度下降的方法求 出当损失函数达到最小的时候的权重参数 𝑤,继而完成模型构建。 :::

16.(判断)迭代开始时,参数是随机的,可以为任何值。
true
false :::info

梯度下降算法 Gradient Descent Method PDF.168

梯度下降算法通过迭代法来找到一个函数的最小值。 
梯度下降算法的目标是在损失函数上随机一个初始点,然后根据负梯度方向,找到损失函数的全 局最小值,此时的参数值就是我们要求的最佳参数值 
A点:(𝑤𝑤0, 𝑤𝑤1) 被随机初始化后的位置, (𝑤𝑤0, 𝑤𝑤1)是我 们要求的参数。 
AB连线:利用负梯度方向下降形成的轨迹, 每次下降(𝑤𝑤0, 𝑤𝑤1) 的值都会变化,回归线变化 
B点:损失函数的全局最小值,此时我们也找到了 最终的(𝑤𝑤0, 𝑤𝑤1) 的值。
image.png :::

Summary

First, this course describes the definition and classification of machine learning, as well as problems machine learning solves. Then, it introduces key knowledge points of machine learning, including the overall procedure (data collection, data cleansing, feature extraction, model training, model training and evaluation, and model deployment), common algorithms (linear regression, logistic regression, decision tree, SVM, naive Bayes, KNN, ensemble learning, K-means, etc.), gradient descent algorithm, parameters and hyper-parameters. 
Finally, a complete machine learning process is presented by a case of using linear regression to predict house prices.