TensorFlow

问题1: TensorFlow的主要功能是什么?

Tensorflow具有对多种语言的API支持, 例如Matlab和C ++。研究人员一直在努力使它变得更好。还引入了一个javascript库tensorflow.js, 用于训练和部署机器学习模型。

问题2:TensorFlow有什么优势?

TensorFlow的一些主要优点如下:

  • 可以轻松地在CPU和GPU上对其进行培训, 以进行分布式计算。
  • 它具有自动区分功能。
  • 它具有平台灵活性。
  • 它易于定制和开源。
  • 它对线程, 异步计算和队列具有高级支持。

问题3:描述大多数TensorFlow算法的通用步骤吗?

  • 通过占位符导入数据, 生成数据或设置数据管道。
  • 通过计算图输入数据。
  • 评估损失函数的输出。
  • 使用反向传播来修改变量。
  • 重复直到停止状态。

问题4:处理TensorFlow中的过拟合问题。

  • 辍学技巧
  • 正则化
  • 批量标准化

问题5: 过拟合的原因以及其造成的结果

过拟合的原因: ① 如果我们有很多的特征或模型很复杂,则假设函数曲线可以对训练样本拟合的非常好,学习能力太强了,但是丧失了一般性。 ② 眼见不一定为实,训练样本中肯定存在噪声点,如果全都学习的话肯定会将噪声也学习进去。

过拟合造成什么结果: 过拟合是给参数的自由空间太大了,可以通过简单的方式让参数变化太快,并未学习到底层的规律,模型抖动太大,很不稳定,variance变大,对新数据没有泛化能力。

问题6:逻辑回归和线性回归简单介绍及区别?

深度学习算法

问题1:解决训练样本类别不平衡问题?

现象:训练样本中,正负样本数量的比例较大。

  1. 过采样。增加正例样本数量,使得正负样本数量接近,然后再进行学习。
  2. 欠采样。去除反例样本数量,使得正负样本数量接近,然后再进行学习。
  3. 设置阈值。基于原始数据集学习,当使用已训练好的分类器进行预测时,将正负样本数量的比例作为阈值嵌入到决策过程中。