Charlotte77 数学系的数据挖掘民工
    推荐你几本书吧:集体智慧编程、机器学习实战、统计学习方法。
    ESL:Elements of statistical learning
    其实机器学习除了数学之外,还有一个非常重要的方向,就是分布式架构。如今互联网公司的数据规模,都非常依赖Hadoop之类的分布s式架构来做机器学习。
    题主更擅长非数学类的CS知识的话,那么走架构的道路会非常适合你。现在大规模机器学习的架构还有很多空白领域,很多问题在业界内并没有通用的解决方案。Hadoop和Spark目前也只能解决其中的一小部分问题,遇到非线性模型和非凸模型(概率图,神经网这种)都需要专门开发一套新的框架。
    数据量小的话可以只用python,但是数据量大的话,可以用python+c,或者mapreduce,不然跑算法跑到你先
    一名调包侠,再成为一名调参侠
    个人感觉:Java跑得更快,在WEKA上做数据分析会更“舒服”。但python更加全面,适用性更广。
    华为云计算(openstack开发)
    BI 商业智能
    hadoop是分布式的计算框架,但从框架角度上,它和DM,ML根本没有可比性。hadoop只是为了大数据量适应硬件瓶颈的一个平台,你用它来做什么东西都可以,做DM,ML当然也可以了。
    数据挖掘的话,可能更多地是在分析,挖掘数据关联,等等。。这个由于工业派我不熟悉就不乱讲了。
    在技术层面上,hadoop+spark等等是在当前大数据背景下进行数据挖掘等数据活动的基础。
    在科研领域的话,可以说,hadoop等方向更加偏向工程实现,而数据挖掘更加偏向模式设计。至于在职业道路生涯方面,不太了解,不过希望回答能够给题主帮助。
    运维DBA?
    经验分享:大学生研究生如何找到一份数据挖掘的工作
    数据!
    云计算是规模效应,对于公司的好处是节约成本。大多数公司就是个服务器的事儿,冠上个云计算的高帽。
    真正做云计算的分布式计算技术,那是一般本科毕业就能做的呀,这样去引导,反而误了一大批人。
    做云计算需求量其实并不大,这个行业本身的需求就是让更少的人管理更多的机子,程序员越来越少,毕业生越来越多,真心消化不了这么多人啊。
    数据仓库
    数学出身的人matlab玩的好,实习的时候北大数学系一哥们matlab玩的炉火纯情,各种新算法可以使用matlab秒实现;
    统计出身的一般会学R,因为r的统计真的好强大,包括前期的数据探索,可视化等等都做的不错;
    工程出身的一般会比较喜欢python,因为相比较其他两种而言,python的工程性更好,而且python本身也可以做后端,使得它的一体型很好。不过殊途同归,都可以用来玩数据挖掘
    http://bbs.cloud.icybee.cn/article/ML_DM/20768?p=1
    从零开始学数据挖掘,靠谱吗?求推荐学习路线
    金融行业大数据分析的入门经
    全牌照金融集团
    重要技能:
    统计学知识
    SAS&SQL编程能力(SAS 软件很贵,有机会接触很重要)
    核心:经济学知识和业务理论
    锦上添花:文字、表达
    大数据分析:使用全量数据代替样本数据 来分析
    海量的有价值数据 金融企业对个人数据掌控相对全面,但互联网企业也在奋起直追。
    京东已经是全牌照集团
    数据分析很严谨 数据
    爱找统计学的学生
    统计学很重要 中台工作
    《SAS 9.2从入门到精通》
    数据清洗
    **大数据:相关分析代替因果分析?
    金融企业中还是会要因果分析,要找到业务上的理论支持
    在互联网企业中,数据驱动的能力会更强一点~
    金融行业 中台数据分析专业的 排序:统计学>金融> 计算机
    smart is the new sexy
    软技能 soft skills
    数据挖掘&机器学习-讲座 - 图1
    后台偏技术
    中台偏业务
    写脚本 数据开发人员
    跑脚本 数据运营人员 ==>给需求方
    数据平台规划:沟通 中台和后台
    数据挖掘&机器学习-讲座 - 图2
    金融公司 数据质量稳定, 都是有价值数据
    深度上有,但是广度上比互联网公司相比有缺陷
    客户经营分析、客户洞见、战略规划
    阿里小贷