数据资源,除了数值数据之外,还包括多种形式,比如文本数据、语音数据、视频数据等。举个例子,淘宝或京东的商品评论数据就是一个典型的文本数据,这类数据可以通过情感识别的算法模型,进行用户情感评价。
工作方法,基于机器学习和人工智能,发现数据潜藏的价值,主要采用决策树算法、逻辑回归算法、神经网络算法、贝叶斯分类算法、聚类算法、关联分析算法等算法模型。比如,用户分类画像问题,就可以通过聚类算法来处理。
工作流程,有一个行业标准过程模型,即 CRISP-DM,它把该流程分为了 6 个环节,包括业务理解、数据理解、数据准备、数据建模、模型评估和模型发布,