dev set和test set一定要来自同一个distribution。例如,你不能dev set全是美洲的数据而test set全是亚洲的数据。又例如,你不能拿dev set全是中产阶级的收入而test set全是低收入阶层的收入 dev set的目的:比较是A classifier好还是B classifier好 test评估最后的cost function