梵风衣超图嵌入
特征维度
d=256
∥v∥=1.24
注意力权重
α=0.68
◊=1.24
梯度范数
▽=0.85
η=3e-4
参数空间: θ
t
∈ ℝ
256
损失曲面: L(θ) =
0.68
优化轨迹: ||θ
t+1
-θ
t
|| =
0.00