×

正则化

正则化长细比是多少?正则化的通俗解释

admin admin 发表于2022-09-06 22:57:19 浏览359 评论0

抢沙发发表评论

本文目录

正则化长细比是多少


正则化长细比也叫通用长细比,即λ/λy,λy为欧拉临界应力正好等于材料屈服点fy时的长细比。将图形的横坐标用通用长细比表示时可以将该图形曲线通用于不同钢号的材料。

参数,其值等于钢材受弯、受剪或受压屈服强度与相应的构件或板件抗弯、抗剪或抗承压弹性屈曲应力之商的平方根。

λ=μl/i, μ与连接方式有关,l为计算长度,i为惯性半径,i=(I/A)^0.5, I为惯性矩,A为面积。材料力学中压杆稳定那章就有介绍。

根据现在的钢结构规范,长细比计算有两个目的。

第一,看看有没有超过容许长细比的限值,这个目的是不用考虑钢材的牌号(或是屈服强度)。

第二,当然是计算受压构件的稳定性。规范中求稳定系数是是把长细比λ正则化,或叫通用长细比,记做λn=λ/π sqrt(E/Fy)。

它有一个弹性屈曲和非弹性屈曲的界限长细比,4.71sqrt(E/Fy),如果长细比λ小于这个值,柱子发出屈曲时会有塑性区出现。

稳定应力为Fy*0.658 Fy/Fe否则即为弹性屈曲稳定应力为0.877Fe。其中Fe=π2E/λ2可见此值就是欧拉荷载。比如说Fy=345MPa,那么界限长细比为115。所以柱子的稳定系数是和其强度有一定关系的,就在于是发生弹性屈曲还是非弹性屈曲。 -正则化


正则化的通俗解释


正则化:
1. 正则化的目的:防止过拟合!
2. 正则化的本质:约束(限制)要优化的参数。
关于第1点,过拟合指的是给定一堆数据,这堆数据带有噪声,利用模型去拟合这堆数据,可能会把噪声数据也给拟合了,这点很致命,一方面会造成模型比较复杂(想想看,本来一次函数能够拟合的数据,现在由于数据带有噪声,导致要用五次函数来拟合,多复杂!),另一方面,模型的泛化性能太差了(本来是一次函数生成的数据,结果由于噪声的干扰,得到的模型是五次的),遇到了新的数据让你测试,你所得到的过拟合的模型,正确率是很差的。
关于第2点,本来解空间是全部区域,但通过正则化添加了一些约束,使得解空间变小了,甚至在个别正则化方式下,解变得稀疏了。这一点不得不提到一个图,相信我们都经常看到这个图,但貌似还没有一个特别清晰的解释,这里我尝试解释一下,图如下:

这里的w1,w2都是模型的参数,要优化的目标参数,那个红色边框包含的区域,其实就是解空间,正如上面所说,这个时候,解空间“缩小了”,你只能在这个缩小了的空间中,寻找使得目标函数最小的w1,w2。左边图的解空间是圆的,是由于采用了L2范数正则化项的缘故,右边的是个四边形,是由于采用了L1范数作为正则化项的缘故,大家可以在纸上画画,L2构成的区域一定是个圆,L1构成的区域一定是个四边形。
再看看那蓝色的圆圈,再次提醒大家,这个坐标轴和特征(数据)没关系,它完全是参数的坐标系,每一个圆圈上,可以取无数个w1,w2,这些w1,w2有个共同的特点,用它们计算的目标函数值是相等的!那个蓝色的圆心,就是实际最优参数,但是由于我们对解空间做了限制,所以最优解只能在“缩小的”解空间中产生。
蓝色的圈圈一圈又一圈,代表着参数w1,w2在不停的变化,并且是在解空间中进行变化(这点注意,图上面没有画出来,估计画出来就不好看了),直到脱离了解空间,也就得到了图上面的那个w*,这便是目标函数的最优参数。
对比一下左右两幅图的w*,我们明显可以发现,右图的w*的w1分量是0,有没有感受到一丝丝凉意?稀疏解诞生了!是的,这就是我们想要的稀疏解,我们想要的简单模型。
还记得模式识别中的剃刀原理不?倾向于简单的模型来处理问题,避免采用复杂的。【剃刀原理:剃刀是一种经验法则,用于允许排除(刮掉)不可能的解释或者情况。另提一句,剃刀是一种有效的思维方式,但事实上并不是严格意义上的“定理”。】
这里必须要强调的是,这两幅图只是一个例子而已,没有说采用L1范数就一定能够得到稀疏解,完全有可能蓝色的圈圈和四边形(右图)的一边相交,得到的就不是稀疏解了,这要看蓝色圈圈的圆心在哪里。
此外,正则化其实和“带约束的目标函数”是等价的,二者可以互相转换。关于这一点,
通过熟悉的拉格朗日乘子法(注意这个方法的名字),

看到没,这两个等价公式说明了,正则化的本质就是,给优化参数一定约束,所以,正则化与加限制约束,只是变换了一个样子而已。
此外,我们注意,正则化因子,也就是里面的那个lamda,如果它变大了,说明目标函数的作用变小了,正则化项的作用变大了,对参数的限制能力加强了,这会使得参数的变化不那么剧烈(仅对如上数学模型),直接的好处就是避免模型过拟合。反之,自己想想看吧。。。
个人感觉,“正则化”这几个字叫的实在是太抽象了,会吓唬到人,其实真没啥。如果改成“限制化”或者是“约束化”,岂不是更好?
-正则化

正则化 到底指什么


由普通字符(例如字符 a 到 z)以及特殊字符(称为元字符)组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。

正则化的介绍


正则化(regularization),是指在线性代数理论中,不适定问题通常是由一组线性代数方程定义的,而且这组方程组通常来源于有着很大的条件数的不适定反问题。大条件数意味着舍入误差或其它误差会严重地影响问题的结果。-正则化


什么是正则化希望得到详细定义和例子


图像复原从数学角度考虑,它等价于第一类fredholm积分方程,是一种反问题,具有很大的病态性,因此,必须进行正则化处理。从统计的角度看,正则化处理其实就是一种图像的先验信息约束 。假设图像退化过程用如下模型描述:
g=hf+n (1)
则图像复原即根据观测图像g恢复原始图像f。正则化图像复原从贝叶斯角度来说,可以用map(最大后验概率估计)方法实现,即:
f=argmax{p(f|g)=p(g|f)p(f)/p(g)} (2)
先验分布函数 p(f)可以看成一正则化项。图像复原关键问题是先验模型p(f) 的选取,也可以说图像建模在图像复原中起者中心作用。早期的图像复原方法假设 服从平稳高斯分布,从而导致约束最小二乘图像复原方法;但许多统计试验表明大部分自然图像都不能用平稳高斯分布准确的描述,模型的不准确导致复原的图像质量较差,图像边缘不能很好的保持。mrf (markov random field)在图像复原中起很重要的作用,如果将原始图像看作mrf的一次实现,根据mrf的局部性,可以用局部gmrf(gauss markov random field)对图像进行建模,按照这种方式建立的模型比用平稳高斯分布更为准确,因此所复原的质量也较好。现代很多人热衷于小波变换的图像复原,其原因是图像的小波系数可近似认为互相独立,且能够用简单的统计模型描述(如广义高斯分布等)。我认为小波在图像复原中主要起工具的作用,现在关于小波方法进行图像复原,研究重点应放在对小波系数的统计建模(如小波系数尺度间、尺度内、方向间的相关性等)。由于一般正交小波变换不具有平移不变性和方向较少的特点,基于这些不足,现在的发展是在其他变换域内建立模型,如(冗余小波变换,复小波变换,脊波,曲波等)这仍是一个正在发展的课题,关于对这些变换域系数进行统计建模用于图像复原能够弥补正交小波变换的不足,然而重点仍是对变换系数的统计建模。
正如我们如上所说,图像建模对图像复原起很重要的作用。然而,从计算复杂度的角度考虑,一个好的模型常导致计算上的困难。因为一个好的模型最终导致一个(2)式有多个极值点,从而在计算上必须用一些全局优化算法(如模拟退火等),这导致很大的计算量。
综上分析,图像复原需要两方面的知识需要考虑:1统计建模的知识2计算方法的知识。
两者任一方面的改进,都会推动图像复原的发展。因此,必须懂得数理统计,贝叶斯分析,随机场,优化算法,矩阵论,小波分析等数学课程。
-正则化

(二)正则化


一个样本变量的分布,尤其是其统计方差在很大程度上依赖于取样支撑的大小,支撑越大,方差越小。在一般的统计事件中,样本的支撑应该是相同的,但在地质勘探过程中,尤其是金矿勘探工作中,在确保充分揭示矿体又能反映品位变化的前提下,样品往往采自较小的支撑上,通常只有几十厘米,最大不超过2m,且变化较大。为了便于研究,在进行地质统计学研究之前,必须对所有样品进行正则化,即把所有样品统一到同一支撑上。-正则化

如前所述,某金矿床的样品支撑有钻孔样品和坑道样品两类,这两类样品的支撑的几何形态各不相同,钻孔样品的支撑为直径约66mm的圆柱体,而坑道样品的支撑为横截面为10cm×5cm的长方体,且样品的长度是随矿化脉的厚度及矿化的富集程度的变化而变化的,其值介于0.19~2.35m之间。在进行正则化时,我们不可能对样品支撑的几何形态做任何改变,而只能对其长度做正则化,以达到等长度支撑的规则样品。-正则化

首先,由于钻孔样品只采自矿体带附近和内部,对废石没有采样或采了样但没有进行化学分析,但其测试结果表明其品位值均与围岩中金的背景值相当,由于金的背景值较低,为了保证整个钻孔采样的连续性,便于研究矿体的空间几何形态,暂将废石段的金品位赋为零。对于“这些连续采样”的钻孔,分别将它们正则化为1m长,3m长和5m长的组合样,其相应的正则化金品位的统计结果见下表。我们发现正则化的支撑越大,其金品位越低,且统计方差和品位的变化系数越小,我们认为这一结果与原始样中金品位与其样长之间的负相关关系(其相关系数约为-0.04)及支撑效应有关。-正则化

坑道样品品位沿矿脉走向变化趋势图

正则化样品的金品位统计结果表

在以往的地质统计工作中,人们一直认为正则化样品的均值与其支撑的大小无关,且与原始样的均值相同,只有样本方差随正则化支撑大小的变化而变化,支撑越大,样本方差越小,反之亦然。通过研究发现这一结论是在不考虑原始样品支撑变化的基础上建立的,然而当原始样品具有不等支撑时,这一结论就难以成立。下面我们将从数学原理上对它们之间的关系加以推导。-正则化

首先考虑一维情况,令Z(xi)为原始样品的品位,l(xi)为原始样品的长度,i=1,2,…,n,其中:n为原始样品数,L为正则化后样品的长度,那么,原始样品的总长度TL为

TL=l(x1)+l(x2)+…+l(xn)

正则化后样品的数目为: 其中,int表示取整数。

对于第一个样品Z(x1)来说,如果其长度l(x(x1)≥L,那么第一个正则化样品的品位为Z(x(xi)=Z(x1);否则,应该考虑前几个样品,直到其累计长度达到正则化长度。假设为2个样品,则其正则化品位为-正则化

地质统计学(空间信息统计学)基本理论与方法应用

第二个正则化样品的品位为

地质统计学(空间信息统计学)基本理论与方法应用

但无论怎样,我们总可以推导出正则化后所有新样品金品位Z’(x’j)的均值为

地质统计学(空间信息统计学)基本理论与方法应用

由此可见,正则化样品的均值是原始样品品位的加权平均值,其权系数为

地质统计学(空间信息统计学)基本理论与方法应用

对于给定的工程而言,TL是常数,所以,权系数只与原始样品的样长有关,若所有原始样品均为等样长样品,则每个原始样品在正则化过程中具有相等的权,且正则化样品的均值等于原始样品的算术平均值。

地质统计学(空间信息统计学)基本理论与方法应用

即与原始样品具有相同的均值。否则,正则化后样品的均值将随原始样品的品位与样长的变化而变化,进一步我们可以推导出正则化样品的均值与原始样品的品位与样长的相关系数成反比关系。

显然,如果原始样品的品位与样长之间的相关系数为负,则正则化样品的均值小于原始样品的均值,如果相关系数为0,则正则化样品的均值与原始样品的均值相等,否则正则化样品的均值将大于原始样品的均值。

在二维及三维情况下,我们可以得出同样的结论。

金矿床1号矿脉群0号勘探剖面图

金矿床1号矿脉群1390m标高中段平面图


正则化的方法


求解不适定问题的普遍方法是:用一组与原不适定问题相“邻近”的适定问题的解去逼近原问题的解,这种方法称为正则化方法。如何建立有效的正则化方法是反问题领域中不适定问题研究的重要内容。通常的正则化方法有基于变分原理的Tikhonov 正则化、各种迭代方法以及其它的一些改进方法,这些方法都是求解不适定问题的有效方法,在各类反问题的研究中被广泛采用,并得到深入研究。
正则化:Regularization,代数几何中的一个概念。 就是给平面不可约代数曲线以某种形式的全纯参数表示。
即对于PC^2中的不可约代数曲线C,寻找一个紧Riemann面C*和一个全纯映射σ:C*→PC^2,使得σ(C*)=C 设C是不可约平面代数曲线,S是C的奇点的集合。如果存在紧Riemann面C*及全纯映射σ:C*→PC^2,使得
(1) σ(C*)=C (2) σ^(-1)(S)是有限点集 (3) σ:C*\σ^(-1)(S)→C\S是一对一的映射
则称(C*,σ)为C的正则化。不至于混淆的时候,也可以称C*为C的正则化。
正则化的做法,实际上是在不可约平面代数曲线的奇点处,把具有不同切线的曲线分支分开,从而消除这种奇异性。 正则化就是对最小化经验误差函数上加约束,这样的约束可以解释为先验知识(正则化参数等价于对参数引入先验分布)。约束有引导作用,在优化误差函数的时候倾向于选择满足约束的梯度减少的方向,使最终的解倾向于符合先验知识(如一般的l-norm先验,表示原问题更可能是比较简单的,这样的优化倾向于产生参数值量级小的解,一般对应于稀疏参数的平滑解)。 同时,正则化解决了逆问题的不适定性,产生的解是存在,唯一同时也依赖于数据的,噪声对不适定的影响就弱,解就不会过拟合,而且如果先验(正则化)合适,则解就倾向于是符合真解(更不会过拟合了),即使训练集中彼此间不相关的样本数很少。-正则化


(四)关于正则化


1.正则化的本质

什么是正则化?正则化包括正则化变量和正则化承载两个内容。它是在实际应用中体现区域化变量理论的一个技术环节。

若观测数据为Zv(x),信息点x的承载(支撑)为u[写作u(x)](例如钻探工程的岩心样品,坑道内取的矿样等)。此时,x点的观测数据Zv(x)实际上是点x所在的承载的数据,这个承载占有一定的体积,现实中它不可能是一个纯粹的点数据(纯粹的点数据只是理论上的),因此,代表点x的承载u(x)的数据(如矿石品位)Zv(x)实际上是点x承载的信息平均值。-正则化

地质统计学(空间信息统计学)基本理论与方法应用

平均值Zv(x)即为区域化变量Z(y)在承载u(x)内的正则化变量,其中u(x)称正则化承载。而Zv(x)的运算过程叫做把Z(y)在u(x)上的正则化。所以正则化就是用承载u(x)内的平均值代替原始(点)数据。正则化依赖于正则化支撑(承载)u(x)的大小,形状及方向正则化承载u(x)确定后,正则化变量Zv(x)亦是一个区域化变量,所以又称作是原区域化变量Z(y)的正则化变量。-正则化

2.正则化变量Zv(x)的性质

1)若Z(y)二阶平稳,则Z(x)同样二阶平稳。即满足Z(y)二阶平稳的两个条件:

E[Z(y)]=m(常数)

Cov(协方差函数)[Z(y),Z(y+h)]=[EZ(y),Z(y+h)]-m2=C(h)

同样是满足Zv(y)二阶平稳的条件,将Z(y)和Z(y+h)换成Zv(x)和Zv(x+h)即可。

2)若Z(y)二阶平稳,则正则化变量Zv(x)的变差函数 存在而且平稳,其协方差函数Cv(h)、方差函数Cv(0)和变差函数γv(h)之间亦满足关系式:γv(h)=Cv(0)-Cv(h)(证明从略)

3.正则化(变量的)变差函数的计算公式:

对于变差函数

地质统计学(空间信息统计学)基本理论与方法应用

我们可以把变差函数计算公式看成是用平均品位Zv(x+h)估计平均品位Zv(x)的估计方差 h),u(x+h)]}

因为点半变差函数γ(h)平稳,所以上式右边的后两项相等

地质统计学(空间信息统计学)基本理论与方法应用

式中的γh表示支撑v平移了一个向量h后形成的另一支撑。

当距离h相对于支撑v很大时(h《《r),其平均值γ(v,vh)近似地等于点变差函数γ(h),

即γv(h)≈γ(h) (这个公式在实际工作中很有用)它们的关系如下图所示。

例如,有一个钻孔的所有岩心样品具有相同的样长l和相同的样品横截面积S,当S与l相比甚小时,可以忽略S,这样,就可以把两个岩心样品看成是具有同样长度l和相隔距离为h的两个列线线段,其正则化的变差函数式写成-正则化

地质统计学(空间信息统计学)基本理论与方法应用

见下页图。