34.机器学习与人工智能
机器学习算法让计算机可以从数据中学习,然后自行做出预测和决定
判断是不是垃圾邮件
这人有心律失常吗?
YouTube 的下一个视频该推荐哪个
定义
分类
分类器
做分类的算法叫 “分类器”
案例:把数据简化成 “特征“,对于之前的飞蛾分类例子, 我们用两个特征:”翼展”和”重量”
首先要得到数据(捕捉),然后标记数据(记录特征,专家分类)
用散点图把数据视觉化,画出分界线,这些线叫 “决策边界“
有个表 记录正确数和错误数,这表叫”混淆矩阵“
机器学习算法的目的:最大化正确分类 + 最小化错误分类
弄一个新的飞蛾,测量特征,放到决策空间,叫做未标签数据
生成决策树的 机器学习算法需要选择用什么特征来分类,每个特征用什么值
多个决策树
支持向量机:本质上是用任意线段来切分”决策空间”
“决策树”和”支持向量机”这样的技术发源自统计学
人工神经网络 Artificial Neural Network
类似人类的神经元
深度学习 Deep learning
单个神经元:加权,求和,偏置,激活函数
并向前传播,一次一层,数字最高的就是结果
弱AI, 窄AI Weak AI, Narrow AI
强AI Strong AI
强化学习 Reinforcement Learning
35.计算机视觉
图像是像素网格,每个像素的颜色 通过三种基色定义:红,绿,蓝
颜色跟踪算法是一个个像素搜索, 因为颜色是在一个像素里,很少用这类颜色跟踪算法
检测垂直边缘的算法
把图片转成灰度,某像素是垂直边缘的可能性, 取决于左右两边像素的颜色差异程度,左右像素的区别越大,这个像素越可能是边缘,如果色差很小,就不是边缘
核/过滤器 kernel or filter
这个操作的数学符号,里面的数字用来做像素乘法,总和存到中心像素里
如果要突出那些特征 要用不同的”核”
卷积 convolution
把核应用于像素块,这种操作叫”卷积”,把”核”用于照片中每个像素,垂直边缘的像素值很高
算子 Prewitt Operators
这两个边缘增强的核叫”Prewitt 算子”
“核”能做很多种图像转换 比如这个”核”能锐化图像,这个”核”能模糊图像
维奥拉·琼斯 人脸检测 Viola-Jones Face Detec tion
卷积神经网络 Convolutional Neural Networks
如果我们给神经元输入二维像素 完全就像”卷积” ,输入权重等于”核”的值,神经网络可以学习对自己有用的”核”
来识别图像中的特征
识别出脸之后,可以进一步用其他算法定位面部标志,如眼睛和眉毛具体位置,从而判断心情等信息
跟踪全身的标记点,如肩部,手臂等
36.自然语言处理
词性 Parts of speech
短语结构规则 Phrase structure rules
分析树 Parse tree
语音识别 Speech recognition
谱图 Spectrogram
快速傅立叶变换 Fast Fourier Transform
音素 Phonemes
语音合成 Speech Synthesis