作为互联网产品人,至少应该掌握并熟练使用以下数据分析相关的方法或工具。
● 统计学:掌握基本统计学常识,帮助自己判断、认识数据特点。例如,要理解方差、均值、中位数、众数等概念。
● Excel:Excel具备各种强大功能,足以作为初级、中级数据分析工作者的首选甚至唯一工具。
● SQL:掌握SQL可以快速提取原始数据,并完成数据预处理。
● 数据可视化:在工作实践中,多数情况下都是通过观察图表来发现、识别问题的,采用合适的图表形式,可以让分析更直观、高效,例如通过瀑布图、直方图、桑基图等观察数据特征和变化情况。
● 计算机数据基础:有的时候我们需要对原始数据进行一些编码处理,这就需要理解一些编码基础知识,例如什么是ASCII、UTF-8、UTF-16、Unicode,如何通过Ultra Edit等软件进行编码处理(例如,有时在Linux环境下运行SQL语句,导出的数据需要进行编码转换才能在Windows环境下使用,如果自己不会处理,就需要每次都求助于人);此外还要了解计算机常见的数据存储格式,例如CSV、JSON、XML等。
● 正则表达式(Regular Expression):正则表达式是一种非常巧妙的、用来处理文本的逻辑公式,在某些时刻,使用正则表达式可以解燃眉之急。