1.个人信息

姓名、电话、邮箱、求职意向

2.项目经验

参考资料

做几个数据分析平台Kaggle上的项目,然后详细写到知乎上,当作你的项目经验。

写上参加过Kaggle比赛,我会看简历。 得过一次10%,我会给电话面试。 得过2次或者以上10%,我会给on site面试。 得过一次前10,我们会谈笑风生。 (在 Kaggle 上一次比赛的结果除了排名以外,还会显示三挡: Prize Winner,10% , 25% 。所以刚刚接触 Kaggle 的人很多都会以 25% 或是 10% 为目标。)

Kaggle上的项目竞赛分成下面4个最常见的类别 1)Featured:这些通常是由公司、组织甚至政府赞助的,奖金池最大。 2)Research:这些是研究方向的竞赛,只有很少或没有奖金。它们也有非传统的提交流程。 3)Recruitment:这些是由想要招聘数据科学家的公司赞助的。目前仍然相对少见。 4)Getting Started(练习项目):这些竞赛的结构和 Featured 竞赛类似,但没有奖金。它们有更简单的数据集、大量教程。

第1步:先提交一个最基本的解决方案,熟悉基本的流程 第2步:学习新知识,优化方案进入排名前 50% 第3步:继续学习新知识,优化方案进入排名前 25% 第4步:继续学习新知识,优化方案进入排名前 10%

从gettting start开始

  1. 选择一种编程语言
  2. 学习探索数据的基础
  3. 训练第一个机器学习模型
  4. 解决入门级竞赛
  5. 比赛是为了更好地学习,而不是赚钱

机器学习中最重要的部分是探索数据分析(或EDA)和特征工程,而不是模型拟合

2. 机器学习文章

在深入了解某个领域之前,您可能想知道它是什么。所以,这里有一些文章对机器学习进行了有趣的介绍: ● EliteDataScience上的“如何学习机器学习之自学入门”一篇写得很好的文章,在介绍机器学习方面做得很好,甚至还开设了自学课程! https://elitedatascience.com/learn-machine-learning ● Vishal Maini的“人类学习机器学习指南”本指南旨在供任何人使用。将讨论概率、统计、编程、线性代数和微积分的基本概念,从本系列获得干货无需预备知识。” https://medium.com/machine-learning-for-humans/why-machine-learning-matters-6164faf1df12 ● Vishal Maini的“最佳机器学习资源”本文是上述系列的一部分。我单独提到它是因为它有一套与机器学习相关的非常好非常全面的链接。 https://medium.com/machine-learning-for-humans/how-to-learn-machine-learning-24d53bb64aa1 ● Adam Geitgey的“机器学习很有趣”阅读本系列文章,了解机器学习的优点。虽然这篇比较高深,但它可以作为了解该领域的更多动力。 https://medium.com/@ageitgey

3. 数据科学博客

以下是一些与数据科学相关的好博客,您可以查看: ● 方差解释 http://varianceexplained.org/ ● 成为一名数据科学家 https://www.becomingadatascientist.com ● Mark Meloon https://www.markmeloon.com/ ● Julia Silge https://juliasilge.com/blog/

【项目】

kaggle,阿里天池,datafountain

游戏

kaggle:
https://zhuanlan.zhihu.com/p/133292934
https://blog.csdn.net/qq_34069667/article/details/105700748

r语言的书:
https://github.com/jiabiao1602/Game_DataMining_With_R
git clone
https://github.com/jiabiao1602/Game_DataMining_With_R.git
爬虫taptap,steam
数据报告

其次,游戏数据有哪些?
针对游戏行业而言,根据数据和游戏业务结合的紧密程度,可以把数据分为四层:
第一层:业务常规数据,这是最基础的数据,比如用户名、密码、竞技场排名、账号对钻石数、背包里的信息等,这一层的数据是业务最重要的数据,一旦出现问题会影响业务的正常运作。
第二层:用户行为数据,指的是通过系统记录的用户在游戏中的行为轨迹,比如充值、通关、升级、突破等,这部分数据量最大,也是最有挖掘价值的一块。
第三层:产品运营数据,指的是针对部分用户行为数据二次抽象出来的指标,比如新增、活跃、留存、付费等,游戏行业常用的运营指标数据约 200-300 左右,这个是做好运营数据分析的基础。
第四层:用户反馈数据,一般产生在游戏产品之外的,指的是用户在论坛、贴吧、TapTap、App Store 等平台对游戏的评价数据,虽然不是在游戏内产生的数据,但是也是玩家讨论的产品相关的数据,提供了另一种数据分析的视角和价值。
通过这些数据可以做游戏舆情分析、玩家行为分析等,4月我们会有一期关于游戏数据应用案例的分享,到时候我再来补充三个实战案例。

作者:数数科技
链接:https://www.zhihu.com/question/22969965/answer/1084939993
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

电商

爬虫
618预测
数据分析之实战项目——电商用户行为分析:https://blog.csdn.net/qq_34069667/article/details/106589931

参考:
https://blog.csdn.net/qq_34069667

【写知乎专栏】

就是dw的,写总结。

sql

excel

python基础

基本数据类型,函数,条件循环,list,生成式,字符串和字典,模块,第三方库。

python第三方库

统计学

假设检验,ab test

机器学习

吴恩达大牛斯坦福大学的公开课,难度会比coursera上的课程更高一些,对于可以翻墙的同学,可以去youtube上找台湾国立大学林轩田老师的《机器学习基石》和《机器学习技法》

运营与产品知识

数据分析思维

《精益数据分析》、《增长黑客》、《数据化管理:洞悉零售及电子商务运营》、《数据挖掘与数据化运营实战 思路、方法、技巧与应用》
《从点子到产品:产品经理的价值观与方法论》、《俞军产品方法论》、《产品思维》

项目

爬虫

国家数据爬虫
https://mp.weixin.qq.com/s/CiaD27XWNEDb8oBTY4gpFg

1、假设抖音的人均活跃时长下降了,你该如何分析这个问题?
2、网易云音乐之前有一个每天给你推10首歌的功能,如果让你设计指标来衡量这个功能的效果,你会设计哪些指标?
3、很多信息流app在新用户第一次注册时,都会让他们去选择兴趣标签,如果想让你做这个功能的专题分析,你会怎么设计你的报告框架?

做的数据分析要具有聚焦,领域相关。
简历中的项目如何体现实战能力? 如何有技巧地描述你做过的项目?
在简历中描述项目的时候,考虑以下几点:
● 采用了什么技术?
● 做了什么分析?
● 达到了怎样的效果?提供量化效果的数值,例如处理的数据量、APP发布的功能、提升了30%的用户增长量等。

第一层境界:了解要面试的行业基本信息;
第二层境界:在网上找到一些实际的案例文章,再加上自己的见解;
第三层境界:爬取竞品相关数据,并生成一个数据分析和可视化的报告。
如果能做到第三层境界,基本上能做到一击必中。

image.png

3.知识技能

使用熟悉
image.png

4.教育背景

5.工作经验

之前的工作,与之相关。
比如做过后台统计模块,熟悉各种指标,做过程序埋点,熟悉sql使用,快速学习,能利用python写小工具,解决问题。爬虫等

面对困境,目标,做了什么,效果如何
分别是Situation(情景)、Task(任务)、Action(行动)和Result(结果)。

6.投递网站

首选智联招聘、51job、拉勾网、Boss直聘。然后一线城市投拉勾网比较管用,其他城市投智联招聘,应届生平台。内推网:http://www.neitui.me