1. nn的weight必须被初始化为非0的数,如果都是0那就跟只有一个neuron的logistic regression没差别