学习方法-MAS

MAS(

  • Muilti-Dimension 多角度
  • Ask 不懂就问
  • Sharing 最好的学习就是分享

Muilti-Dimension 多角度

学会多角度面对问题,通过不同的角度往往可以发现事物的多方面性。正所谓“有一千个人,就有一千个哈曼雷特”,不同角度出发,不仅视角不同,面对的问题也是不同的。而从多角度出发,就需要我们站在不用的角度分别思考,最终结合各个角度的特点,进行综合分析总结,通过这种方式我们在处理事情时往往可以面面俱到,考虑周全。但在多角度的同时,我们应该分清楚角度的主次关系,不能本末倒置,进而因小失大。

Ask 不懂就问

在学习进步的历程中,我们会不断遇到难以解决的问题,而不懂就问不疑是一种好的解决问题的办法。不懂就问不仅是一种行为,更是一种学习的态度。积极向上的态度往往可以帮助我们更好的解决问题。但需要注意的是在寻求帮助前,应有自身的思考,这也是学生思维和工作思维的重要区别。带着问题去解决问题,往往会比一无所知去面对问题,更高效,有用。

Sharing 最好的学习就是分享

分享,将自身在解决问题中的经验分享给他人,帮助他人解决问题。在分享的过程中,可以帮助自己更加熟练自己运用到的知识,也会让我们对所学知识有更深的理解,及时弥补解决方案中不足的地方,吸取经验改进方案,从而达到更好的效果。

数据分析视角

概念

什么是数据分析?

数据分析本质上是一种经验科学,就是采用适当的统计分析方法对收集来的大量数据进行分析,提取有用的信息和形成结论从而对数据加以详细研究和概括总结的过程。

工具

工具主要有SQL(主流为Mysql,Orcale),Excel,Python,PowerBi,Tableau等。

数据分析三大组成部分

数据采集

数据采集可以分为数据源头,使用工具,采集办法等方面。数据源可以分为爬虫程序,系统日志,系统数据,传感器数据等。工具可以使用“八爪鱼”、“搜集客”等,爬虫可以是Scrapy,PySpider,Beautifulsoup等。

数据挖掘

什么是数据挖掘?

数据挖掘顾名思义可以理解为从大量数据中挖掘出其中隐藏的信息。其目的是为了建立一个决策模型,根据过去的行动数据来预测未来的行为。根据模型算法,利用数据,推断出可能会发生的动作行为。
数据挖掘往往会涉及数学知识,例如概率论与数据统计、线性代数、图论、最优化方法等,通过数学方法我们可以更方便快捷的构建出需要的模型,进而进行数据计算。整个数据挖掘过程可以梳理为,先进行业务理解,清晰数据建设目的,然后对涉及数据进行理解。在将业务和数据进行关联和理解的过后,我们就需要进行数据的准备了,这时就需要运用到爬虫或其他采集数据的工具了,在对数据进行ELT(抽取,转换,加载),然后就进行建模,通过参数调优等方法来达到我们预期的效果。在模型部署之前对其进行技术和商业分析,考虑其完善性,最终根据需要和业务进行部署。

数据挖掘十大算法

下面罗列一下数据挖掘中十大算法。分类算法(C4.5、朴素贝叶斯、SVM、KNN、Adaboost、CART),聚类算法(K-Means,EM),关联分析(Apriori),连接分析(PageRank)

数据可视化

什么是数据可视化?

数据可视化就是将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中的未知信息。

在日常的工作中我们可以用matplotlib,Seaborn,DataV等工具来进行数据的可视化。

数据分析师原则

  1. 不重复造轮子。适当的重复工作可以提高你对技能的运用,但过多的重复,只会让自己沦为造轮子的机器人,所以我们应当避免过多的重复造轮子。
  2. 工具决定效率。采用合适的工具往往可以帮助你更快的解决问题,从而实现效率的提升。有时可能不是你效率低,而有可能是你选错了工具。
  3. 提高熟练度。熟能生巧,通过对工具和技巧的熟练使用,我们可以更好的投入到分析工作中去,从而避免当一个无情的”提数人”。
  4. 知业务善分析。提升工具使用能力和效率固然重要,但我们更应该将数据贴合实际业务,懂得更多的业务知识,进而让数据为业务服务,而不是让数据脱离实际业务。采用合理的分析方法,而不追求高级分析方法和模型,从而让数据分析结论变得更为合理和实际。

    总结

    如何入门数据分析,如何学习数据分析?想要学习一门技术就应该从适合自己的学习办法开始,本文介绍了MAS学习方法,通过对事物多角度的理解,带着问题去学习请教,再从经验中汲取经验,这未尝不是一种好的学习方法。从数据分析中涉及的概念工具、组成部分和原则等方面对数据分析进行介绍,从而对数据分析有一个初步的了解。