会议纪要

1.从增加block的结果来看,调整CNNtransformer的深度对模型的预测结果帮助不大,可以尝试增加模型宽度。
2.从最好的CNNtransformer(Conv13,Conv9)结果来看,overfitting问题并不严重,但是training的performance并没有LSTMTransformer高,说明可以进一步增加模型复杂度。
3.减少CNNtransformer模型的训练时间,因为很显然在前1/3处就已经达到模型最优了。
4.继续增加LSTMTransformer的复杂度,来做model ensemble。

ToDo

1.继续增加LSTMTransformer的复杂度,来做model ensemble
2.进一步增加CNNtransformer的复杂度。