AI算法之基础一:线性代数
机器人网是ASPENCORE跨国媒体集团下的明星媒体之一,主要专注AI、机器人、自动驾驶、无人机、区块链等科技前沿,拥有全球海内外数名高级产业分析师,将定期进行独家分析,发表独特观点,以供行业参考。欢迎点击上方关注。投稿请留言。
本文作者华校专,曾任阿里巴巴资深算法工程师、智易科技首席算法研究员,现任腾讯高级研究员,《Python 大战机器学习》的作者。
这是作者多年以来学习总结的笔记,经整理之后开源于世。考虑到出版时间周期较长,而且书本购买成本高不利于技术广泛传播,因此作者采取开源的形式。 笔记内容仅供个人学习使用,非本人同意不得应用于商业领域。
一、基本知识
本书中所有的向量都是列向量的形式:
本书中所有的矩阵都表示为:
简写为:或者。
矩阵的
F
范数:设矩阵,则其F
范数为:。它是向量的范数的推广。
矩阵的迹:设矩阵,则的迹为:。
迹的性质有:
的
F
范数等于的迹的平方根:。的迹等于的迹:。
交换律:假设,则有:。
结合律:。
二、向量操作
一组向量是线性相关的:指存在一组不全为零的实数,使得:。
一组向量是线性无关的,当且仅当时,才有:。
一个向量空间所包含的最大线性无关向量的数目,称作该向量空间的维数。
三维向量的点积:。
三维向量的叉积:
其中分别为轴的单位向量。
和的叉积垂直于构成的平面,其方向符合右手规则。
叉积的模等于构成的平行四边形的面积
三维向量的混合积:
其物理意义为:以为三个棱边所围成的平行六面体的体积。 当构成右手系时,该平行六面体的体积为正号。
两个向量的并矢:给定两个向量,则向量的并矢记作:
也记作或者。
三、矩阵运算
给定两个矩阵,定义:
阿达马积
Hadamard product
(又称作逐元素积):克罗内积
Kronnecker product
:设为阶向量,为阶方阵,则有:
如果是一元函数,则:
其逐元向量函数为:。
其逐矩阵函数为:
其逐元导数分别为:
各种类型的偏导数:
标量对标量的偏导数:。
标量对向量(维向量)的偏导数 :。
标量对矩阵(阶矩阵)的偏导数:
向量(维向量)对标量的偏导数:。
向量(维向量)对向量 (维向量) 的偏导数(雅可比矩阵,行优先)
如果为列优先,则为上面矩阵的转置。
矩阵(阶矩阵)对标量的偏导数
对于矩阵的迹,有下列偏导数成立:
假设是关于的矩阵值函数(),且是关于的实值函数(),则下面链式法则成立:
四、特殊函数
这里给出机器学习中用到的一些特殊函数。
4.1 sigmoid 函数
sigmoid
函数:该函数可以用于生成二项分布的参数。
当很大或者很小时,该函数处于饱和状态。此时函数的曲线非常平坦,并且自变量的一个较大的变化只能带来函数值的一个微小的变化,即:导数很小。
4.2 softplus 函数
softplus
函数:。该函数可以生成正态分布的参数。
它之所以称作
softplus
,因为它是下面函数的一个光滑逼近:。如果定义两个函数:
则它们分布获取了的正部分和负部分。
根据定义有:。而逼近的是,逼近的是,于是有:
sigmoid
和softplus
函数的性质:其中为反函数。
也称作
logit
函数。
4.3 伽马函数
伽马函数定义为:
性质为:
对于正整数有:。
,因此伽马函数是阶乘在实数域上的扩展。
与贝塔函数的关系:
对于有:
则可以推导出重要公式:。
对于,伽马函数是严格凹函数。
当足够大时,可以用
Stirling
公式来计算Gamma
函数值:。
4.4 贝塔函数
对于任意实数,定义贝塔函数:
其它形式的定义:
性质:
对于任意正实数,有:
。
连续性:贝塔函数在定义域内连续。
对称性:。
递个公式:
当较大时,有近似公式:
与伽马函数关系:
对于任意正实数,有:
。