TensorFlow
问题1: TensorFlow的主要功能是什么?
Tensorflow具有对多种语言的API支持, 例如Matlab和C ++。研究人员一直在努力使它变得更好。还引入了一个javascript库tensorflow.js, 用于训练和部署机器学习模型。
问题2:TensorFlow有什么优势?
TensorFlow的一些主要优点如下:
- 可以轻松地在CPU和GPU上对其进行培训, 以进行分布式计算。
- 它具有自动区分功能。
- 它具有平台灵活性。
- 它易于定制和开源。
- 它对线程, 异步计算和队列具有高级支持。
问题3:描述大多数TensorFlow算法的通用步骤吗?
- 通过占位符导入数据, 生成数据或设置数据管道。
- 通过计算图输入数据。
- 评估损失函数的输出。
- 使用反向传播来修改变量。
- 重复直到停止状态。
问题4:处理TensorFlow中的过拟合问题。
- 辍学技巧
- 正则化
- 批量标准化
问题5: 过拟合的原因以及其造成的结果
过拟合的原因: ① 如果我们有很多的特征或模型很复杂,则假设函数曲线可以对训练样本拟合的非常好,学习能力太强了,但是丧失了一般性。 ② 眼见不一定为实,训练样本中肯定存在噪声点,如果全都学习的话肯定会将噪声也学习进去。
过拟合造成什么结果: 过拟合是给参数的自由空间太大了,可以通过简单的方式让参数变化太快,并未学习到底层的规律,模型抖动太大,很不稳定,variance变大,对新数据没有泛化能力。
问题6:逻辑回归和线性回归简单介绍及区别?
深度学习算法
问题1:解决训练样本类别不平衡问题?
现象:训练样本中,正负样本数量的比例较大。
- 过采样。增加正例样本数量,使得正负样本数量接近,然后再进行学习。
- 欠采样。去除反例样本数量,使得正负样本数量接近,然后再进行学习。
- 设置阈值。基于原始数据集学习,当使用已训练好的分类器进行预测时,将正负样本数量的比例作为阈值嵌入到决策过程中。