定义
给定两个矩阵 A=(ai,j)∈Rm×n,B=(bi,j)∈Rm×n。
1. 阿达马积 Hadamard product(又称作逐元素积)
阿达马积,也称为逐元素积,是两个相同维度的矩阵对应元素相乘的结果。
A∘B=⎣⎢⎢⎡a1,1b1,1a2,1b2,1⋮am,1bm,1a1,2b1,2a2,2b2,2⋮am,2bm,2⋯⋯⋱⋯a1,nb1,na2,nb2,n⋮am,nbm,n⎦⎥⎥⎤
注:

雅克-所罗门·阿达马(Jacques-Salomon Hadamard,1865 年 12 月 8 日生于法国凡尔赛 - 1963 年 10 月 17 日卒于巴黎)是一位法国数学家,他证明了素数定理,该定理指出,当 n 接近无穷大时,π(n)接近 lnnn,其中π(n)是不大于 n 的正素数数。
注:
为什么不翻译为 “哈达玛”,因为看网上说此处的h在法语中不发音。
2. 克罗内克积(Kronecker Product)
克罗内积是两个矩阵的张量积,结果是一个分块矩阵。
A⊗B=⎣⎢⎢⎡a1,1Ba2,1B⋮am,1Ba1,2Ba2,2B⋮am,2B⋯⋯⋱⋯a1,nBa2,nB⋮am,nB⎦⎥⎥⎤
注:

克罗内克,德国数学家。对代数和代数数论,特别是椭圆函数理论有突出贡献。
小结:
- 阿达马积:
对应元素相乘
,要求两个矩阵维度相同。 - 克罗内克积:生成一个
分块矩阵
,不要求两个矩阵维度相同。
基本公式
设a⃗,b⃗,c⃗,x⃗ 为 n 阶向量,A,B,C,X为 n 阶方阵,则有:
注:
a⃗,b⃗,c⃗ 是常量向量
x⃗ 是变量常量
A,B,C 是常量矩阵
X 是变量矩阵
1. 向量导数的基本公式
∂x⃗∂(a⃗Tx⃗)=∂x⃗∂(x⃗Ta⃗)=a⃗
2. 矩阵导数的基本公式
∂X∂(a⃗TXb⃗)=a⃗b⃗T=a⃗⊗b⃗∈Rn×n
∂X∂(a⃗TXTb⃗)=b⃗a⃗T=b⃗⊗a⃗∈Rn×n
∂X∂(a⃗TXa⃗)=∂X∂(a⃗TXTa⃗)=a⃗⊗a⃗
∂X∂(a⃗TXTXb⃗)=X(a⃗⊗b⃗+b⃗⊗a⃗)
3. 复合函数的导数
∂x⃗∂[(Ax⃗+a⃗)TC(Bx⃗+b⃗)]=ATC(Bx⃗+b⃗)+BTC(Ax⃗+a⃗)
∂x⃗∂(x⃗TAx⃗)=(A+AT)x⃗
∂X∂[(Xb⃗+c⃗)TA(Xb⃗+c⃗)]=(A+AT)(Xb⃗+c⃗)b⃗T
∂X∂(b⃗TXTAXc⃗)=ATXb⃗c⃗T+AXc⃗b⃗T
逐(zhú)元
1. 逐元向量函数
如果 f 是一元函数,则:
f(x⃗)=(f(x1),f(x2),⋯,f(xn))T
f(X)=⎣⎢⎢⎡f(x1,1)f(x2,1)⋮f(xm,1)f(x1,2)f(x2,2)⋮f(xm,2)⋯⋯⋱⋯f(x1,n)f(x2,n)⋮f(xm,n)⎦⎥⎥⎤
问题:???
我看网上有人说://需要考证
逐元向量函数为
f(X)=⎣⎢⎢⎡f(x1,1)f(x2,1)⋮f(xm,1)f(x1,2)f(x2,2)⋮f(xm,2)⋯⋯⋱⋯f(x1,n)f(x2,n)⋮f(xm,n)⎦⎥⎥⎤
2. 逐元导数
逐元导数分别为:
f′(x⃗)=(f′(x1),f′(x2),⋯,f′(xn))T
f′(X)=⎣⎢⎢⎡f′(x11)f′(x21)⋮f′(xm1)f′(x12)f′(x22)⋮f′(xm2)⋯⋯⋱⋯f′(x1n)f′(x2n)⋮f′(xmn)⎦⎥⎥⎤
总结
逐元向量函数:将一元函数 f 应用于矩阵 X 的每个元素。
逐元导数:将一元函数的导数 f′ 应用于矩阵 X 的每个元素。
偏导数
1. 标量对标量的偏导数
∂v∂u
2. 标量对向量的偏导数
∂v∂u=(∂v1∂u,∂v2∂u,⋯,∂vn∂u)T
3. 标量对矩阵(m×n阶矩阵)的偏导数
∂V∂u=⎣⎢⎢⎢⎡∂V1,1∂u∂V2,1∂u⋮∂Vm,1∂u∂V1,2∂u∂V2,2∂u⋮∂Vm,2∂u⋯⋯⋱⋯∂V1,n∂u∂V2,n∂u⋮∂Vm,n∂u⎦⎥⎥⎥⎤
4. 向量(m维向量)对标量的偏导数
∂v∂u=(∂v∂u1,∂v∂u2,⋯,∂v∂um)T
5. 向量(m维向量)对向量(n维向量)的偏导数(雅可比矩阵,行优先)
∂v∂u=⎣⎢⎢⎡∂v1∂u1∂v1∂u2⋮∂v1∂um∂v2∂u1∂v2∂u2⋮∂v2∂um⋯⋯⋱⋯∂vn∂u1∂vn∂u2⋮∂vn∂um⎦⎥⎥⎤
如果为列优先,则需要将上面矩阵的进行转置。
6. 矩阵(m×n阶矩阵)对标量的偏导数
∂v∂U=⎣⎢⎢⎢⎡∂v∂U1,1∂v∂U2,1⋮∂v∂Um,1∂v∂U1,2∂v∂U2,2⋮∂v∂Um,2⋯⋯⋱⋯∂v∂U1,n∂v∂U2,n⋮∂v∂Um,n⎦⎥⎥⎥⎤
对于矩阵的迹,有下列偏导数成立
∂X∂tr(AXB)=ATBT
∂X∂tr(AXTB)=BA
∂X∂tr(A⊗X)=AT
∂X∂tr(AXBX)=ATXTBT+BTXAT
∂X∂tr(XTBXC)=BXC+BTXC
∂X∂tr(CTXTBXC)=(B+BT)XCCT
∂X∂tr(AXBXTC)=ATCTXBT+CAXB
∂X∂tr((AXB+C)(AXB+C))=2AT(AXB+C)BT
∂X∂tr(f(X))=(f′(∂X))T