实向量空间的内积是各相应元素乘积的和。具体要如何求出权重向量呢?基本做法和回归时相同:将权重向量用作参数,创建更新表达式来更新参数。
立石贤吾《白话机器学习的数学》PDF+调试代码
《白话机器学习的数学》中文PDF,277页,有详细书签目录,文字可以复制;配套源代码;立石贤吾著
下载: https://pan.baidu.com/s/1_I5hcwjqOiF_SzF_2YHuKw
提取码: cus5
权重向量就是我们想要知道的未知参数,w 是权重一词的英文——weight 的首字母。学习回归时,我们为了求未知参数θ 做了很多事情,而w 和θ 是一样的。
读取大量的数据、学习数据的特征并从中找出数据的模式的任务被称为机器学习或者模式识别,个人行为和生活的一部分已经被数字化,规模大到无法想象的数据也随之而生。不仅是数据量变多了,数据的种类也增加了。其中包括Web 网站的访问记录、博客上发布的博文和照片、邮件的发送记录、电商网站的购买记录等,数不胜数。
人脸识别可以使用SNS 网站上与人物标签一起被上传的图像数据,而推荐系统则可以使用电商网站上的购买记录数据。不管是人脸识别还是推荐系统,都是从数据中学到的成果。比起可以学习到大量知识,计算机能够更快地处理数据,现在可以使用GPU 进行数值计算,Hadoop、Spark 之类的分布式处理技术也逐渐成熟,所以才说现在“具备了能够处理大量数据的环境”。
讲解的基础知识非常实用,掌握这些知识之后,既可以加深对程序库内部机制的理解,也可以去实现机器学习的算法,还可以去阅读最新的论文,总之可以自由尝试各种实践。回归就是在处理连续数据如时间序列数据时使用的技术。时间序列数据就是那些连续观测到的因时而异的数据。
入门知识里经常会提到它。感知机是接受多个输入后将每个值与各自的权重相乘,最后输出总和的模型。