1.当样本数据量小(如10,000)的时候,可以按照 60%,20%,20%的比例来
当样本数据量大(如1,000,000)的时候,因为dev,test只要够用就行,所以可以按照90%,5%,5%或更有甚者95%,2.5%,2.5%来
2.尽量让dev set与test set来自同一种distribution。例如尽量让他俩都来自网友拍的照片(低分辨率)而不是一个set来自网友照片,一个set来自标准数据集(高分辨率)
2.没有test set有时候也行(如果不需要unbiased estimate的话)