梵风衣超图嵌入

特征维度

d=256

∥v∥=1.24

注意力权重

α=0.68

◊=1.24

梯度范数

▽=0.85

η=3e-4

参数空间: θt ∈ ℝ256

损失曲面: L(θ) = 0.68

优化轨迹: ||θt+1t|| = 0.00