先看本来W和b是如何被更新的: 现在要先用exponentially weight average把W和b给平均一下: 然后用新的Vdw,Vdb来更新W和b 效果如下图,与exponentially weight average一样,更大的beta导致更smoother的线。