《成为数据分析师:6步练就数据思维》

— —“没有问题的答案会导致错误的结论。”

提问

定量分析中的好问题以下列举的问题当然不是你可以问的所有问题,只是你可以从这些问题开始。它们几乎适用于任何定量分析,或是该被定量的非定量分析:
1.你有数据来支撑你的假设吗?
2.你能告诉我你在分析中使用的数据源吗?
3.你确定这个样本数据能代表被试的人数吗?
4.你的数据分布中有没有异常值?它们会对结果产生什么样的影响?
5.你的分析背后有什么假设
6.在什么条件下,你的假设和模式是无效的?
7.你能告诉我你为什么要采用这样的分析法吗?
8.你如何转变数据,使其适用于你的模式?
9.你想过用其他方法来分析数据吗?如果有,为什么不用呢?
10.你有没有想过,是独立变量导致了因变量的变化?你还可以进行哪些分析来了解因果关系?

练习定量分析

解决问题的6个步骤
image.png

  1. 识别问题。你工作中可能出现许多问题。根据紧迫性和定量分析适用性将这些问题放在优先解决的位置。在识别问题阶段,最重要的就是全面理解问题及其重要性。对这两个问题的回答不仅包括解决问题需要做些什么,还包括如何促进下一个阶段。
  2. 回顾之前的发现。一旦意识到问题,你就要去调查之前的发现中所有与这个问题相关的东西。尽管在这个阶段你需花费大量的时间,可是利用搜索引擎会对你大有帮助。搜索与问题相关的资料,对弄清问题的真相非常重要,对识别相关变量和从已识别的变量中寻找关联也非常重要。对之前的发现有了综合的理解,就能清楚地知道该如何解决问题。你可以这样说:“问题设计得很好,已回顾的之前的发现:一半以上。”
  3. 建模(选择变量)。如果你通过回顾之前的发现找出了所有相关的变量,那么就一个接一个地扔掉那些与问题不直接相关的变量吧。哪些变量应该丢掉,哪些需要保留,主要取决于模式的目的。如果你要造一辆玩具火车,那么火车的规模就该保留。相反,如果你要计算火车的经济适用性,那么,像吨位、速度、耗油量这些就变得非常相关。集中在某个问题的某些特征上时,你离问题的答案就不远了。而且,你的定量观点也得到了提升。
  4. 收集(测量)数据。要测量已选的变量,你首先要检查你所在的公司是否有人收集了这个数据。很多时候,你手边的数据已经被别的部门,甚至是你自己测量或计算过。你甚至发现,有的数据已被公开使用过。即便你需要花钱买它,也总比你自己收集便宜。当那些与你问题相关的数据不正确时,你要认真想办法改正它。如果你决定展开调查,那么就得认真研究问题的具体设计,甚至问卷的措辞。如果你要通过实验收集数据,你就得去请教实验设计方面的专家。因为,获得正确而即时的数据对解决问题非常重要,在这个阶段,你需要投入足够的时间和精力。
  5. 分析数据。数据分析包括寻找连续的模式,或者变量之间的关系。使用什么样的统计方法,在识别问题阶段就已经决定了:当你彻底了解了问题后,很显然就得选择方法。如果问题是在各个小组之间进行对比,那么你就该相应地选择方法。如果问题是变量之间的依赖关系,那么就该用回归或类似的方法。这些方法在很多情况下都适用,所以,你要花时间去习惯这些方法的观点和应用。此外,你还可以向你公司里的专家寻求意见。
  6. 传达结果并采取行动。别忘了练习这部分非常重要的定量性思维。成功的分析小组在这一阶段所花的时间和前5个阶段所花的时间一样多。和公司的其他人交流,问他们是如何传达分析结果的,然后和他们探讨你对此的观点。学习统计学的可视化语言——比如,把爱德华·塔夫特(Edward Tufte)的书籍当成你的朋友。如果塔夫特来到你所在的城市,讲授“呈现数据与信息”的课程,千万别错过它。

    不懂就后退

    能鼓励分析学的进一步使用的特定问题类型如下:
  • 你忘记了自己的数据吗?
  • 你凭什么认为那个假设可以用数据检验?
  • 你是否曾想过就那个观点进行经验性分析?·我们有X位顾客。
  • 你在每一位顾客身上都试过这种方法吗?
  • 或许你可以针对那个观点进行一次小小的、严密的实验?