dev set和test set一定要来自同一个distribution。例如,你不能dev set全是美洲的数据而test set全是亚洲的数据。又例如,你不能拿dev set全是中产阶级的收入而test set全是低收入阶层的收入

    dev set的目的:
    比较是A classifier好还是B classifier好

    test
    评估最后的cost function