数据分析概念
数据分析是指用适当的统计分析方法和工具,对收集来的大量数据进行分析,提取有用信息和形成结论,对数据加以详细研究和概括总结的过程。
数据分析目标是,通过得到的结论应用到行业中解决实际问题,提升商业效率。
数据分析是将数据转换为信息,在从信息抽象为知识, 智慧和洞察的手段
第谷对天文学的最大贡就,是他长期对行星运动的观测。第谷在汶岛勤奋从事天文观测21年。临终前,他把这笔珍贵的 遗产赠给了他的高足弟子开普勒,使自己的观测成果得到充分的效用。
开普勒通过对第谷的观测数据的研究,提出了行星运动的三大定律,判定行星绕太阳运转是沿着椭圆形轨道进行的, 而且这样的运动是不等速的。
牛顿在开普勒的基础上,采用数学分析方法进行概括和整理,创造了著名的万有引力定律:“宇宙间两天体之间的引力大小 同这两个天体的质量乘积成正比,同两天体间的距离平方成反比。”能解释和包含开普勒行星定律,只要知道天体某几 个瞬间的状态,便能推算出它的运动情况;
万有引力,应用到卫星,进而手机可以使用GPS定位。
应用场景
1、比如某款游戏下载量很高, 但是注册率很低。有没有可能是是注册渠道有问题,服务器有问题还是注册流程bug, 或者近期网络出故障导致。
2、数据分析主要帮助决策者了解情况、发现规律以及预测将来。
假如我是一家做的还不错的卖服装的淘宝店长,我需要知道一天内我卖了多少件商品、挣了多少钱、哪个 品牌卖的多哪个品牌卖的少、哪种商品需要补货、哪种颜色受欢迎等等信息.以便及时做出策略调整,保 持市场竞争优势。这就是了解情况。在经营了一段时间之后,店里积累了一些历史数据,通过对数据的深入分析挖掘,我发现特定人群甲喜欢 购买圆领深色服装,而另一些特定人群乙喜欢购买宽松浅色服装,于是我将圆领深色服装推销给甲,将宽 松浅色服装推销给乙。一些人在买了A品牌T-Shirt之后会购买B品牌短裤,将B品牌短裤购买链接添加在A品 牌T-Shirt购买页的推荐商品中。一部分人在浏览了C页面后会对D品牌产生兴趣,将D品牌促销信息追加到C页面中。于是店中的商品走的更好了,这就是发现规律。又经营一段时间后,我发现E品牌商品总是在被浏览2到3次之后就会被卖出去一件.于是我发现浏览次数与 销售件数之间存在较强的关联关系,于是我想办法增加品牌商品的点击次数,通过浏览量的趋势大致可以 预测出未来一段时间内销量的变化情况,这就是预测将来。
了解情况: 业务描述性数据分析,了解发生过的和正在发生的实际业务情况。
发现规律: 数据挖掘分析,大数据分析,对数据于数据间的关联性深入讨论,发现潜在的业务规律。
预测未来: 数据挖掘分析,大数据分析,通过数据间的相关关系预测未来可能出现的情况。
数据分类
基础数据: 下载量, 激活量, 新增用户量, 活跃用户, 次日留存等
社交产品: 用户年龄、性别分布, 用户留存(次日, 3日, 7日, 次月, 3月)
电商: 淘宝指数, 网站流量, 页面访问深度, 页面访问路径游戏: 用户活跃度, 付费率
内容类: 内容点击率, 留存量, PV, UV
工具类: 功能点击量, 广告收入零售: 提高销量, 预测销售额其他: 竞品数据(下载, 激活)
分析方法
业务数据分析 (主要使用SQL, Excel等)
描述型分析
排查对比分析
数据分组
可视化图表
数据挖掘分析 (主要使用Python, SPSS, SAS, R等)
分类分析(0/1)
关联分析
聚类分析等
大数据分析 (HIVE)
基于Hadoop的HIVE大数据平台
数据整理
建模, 分析与展示
数据分析流程
常用数据分析工具
Excel,Tableau, Power BI, SPSS, SAS 用于业务数据分析
Python, SQL, HIVE SQL 用于大数据统计分析
数据分析云此
数据分析价值
1、 挖掘商机
啤酒和尿不湿
飙风和蛋挞
塔吉特商品推荐
2、数据可视化
将数据高度浓缩, 通过的图表的形式展现出来, 增强数据的展现力, 常见的图形有柱状图, 饼状图, 折线图, 散点图等
3、商业智能(BI)
将企业中现有的数据进行有效的整合, 快速准确的 提供报表服务并提出决策依据, 帮助企业做出明智的业务经营决策
4、用户画像
用户画像最初是在电商领域得到应用的,在大数据时代背景下,用户信息充斥在网络中,将用户的每个具体信 息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务
5、业务增长分析
通过对用户和产品的数据分析,产生对业务的问题和机会点的发掘,从而在业务的增长路径 新增→留存→活跃
→收入→传播 的每一步里带来更多的优化点,从而进行更多方案的选择,在对结果进行ab效果测试,分析测试效果。
数据分析前景
1、行业发展前景
2、就业前景
3、数据分析职业发展
4、岗位关键词
行业趋势
数据存储、计算、传输成本下降。各行业收集数据、使用数据、分析数据的需求增加。迎来的大数据时代的淘 金者。
从这些海量的数据中去获取对我们有价值的规则, 经验, 数据和数据之间的规律,或者说商业环境下的商业规则, 如果我们能够从这些数据中发现行业规律。
通过这些规律来解决一些行业问题, 这个时候就能够取得巨大的收益, 这就是我们现在所面临的时代, 也是这个时代要求我们所需要做的事情, 这也是数据分析的大背景。