w的L1范数和L2范数

news/2024/7/24 12:17:51 标签: 机器学习, 人工智能

L1范数

权重向量 w w w 的 L1 范数,也称为曼哈顿范数或 1-范数,是一个向量的长度或模的度量。它的定义如下:

对于一个 n 维的实数向量 w = [ w 1 , w 2 , . . . , w n ] w = [w_1, w_2, ..., w_n] w=[w1,w2,...,wn],其 L1 范数(Manhattan 范数)表示为:

∥ w ∥ 1 = ∣ w 1 ∣ + ∣ w 2 ∣ + . . . + ∣ w n ∣ \|w\|_1 = |w_1| + |w_2| + ... + |w_n| w1=w1+w2+...+wn

其中 ∥ w ∥ 1 \|w\|_1 w1 表示 w w w 的 L1 范数, w i w_i wi 表示向量 w w w 的第 i 个分量。

L1 范数实际上是向量 w w w 的各个分量的绝对值之和。与 L2 范数不同,L1 范数更加注重向量中每个分量的绝对大小,而不是它们的平方。

机器学习中,L1 范数也常常用作正则化项的一部分,以限制模型参数的大小,防止过拟合。当我们希望模型的参数不仅小,而且尽可能稀疏时,可以在损失函数中添加 ∥ w ∥ 1 \|w\|_1 w1 作为正则化项。L1 正则化有助于将某些模型参数推向零,从而实现特征选择(feature selection),即选择对任务最重要的特征。这对于高维数据的处理和模型解释非常有用。

L2范数

权重向量 w w w 的 L2 范数,也称为 Euclidean 范数或 2-范数,是一个向量的长度或模的度量。它的定义如下:

对于一个 n 维的实数向量 w = [ w 1 , w 2 , . . . , w n ] w = [w_1, w_2, ..., w_n] w=[w1,w2,...,wn],其 L2 范数(Euclidean 范数)表示为:

∥ w ∥ 2 = w 1 2 + w 2 2 + . . . + w n 2 \|w\|_2 = \sqrt{w_1^2 + w_2^2 + ... + w_n^2} w2=w12+w22+...+wn2

其中 ∥ w ∥ 2 \|w\|_2 w2 表示 w w w 的 L2 范数, w i w_i wi 表示向量 w w w 的第 i 个分量。

L2 范数实际上是向量 w w w 到原点的欧几里德距离,它是向量 w w w 的各个分量的平方和的平方根。L2 范数通常用于表示向量的长度或模,它的值永远是非负的。

机器学习中,L2 范数常常用来作为正则化项的一部分,以限制模型参数的大小,防止过拟合。当我们希望模型的参数不要过大时,可以在损失函数中添加 ∥ w ∥ 2 \|w\|_2 w2 作为正则化项,从而鼓励模型选择较小的参数值。这有助于提高模型的泛化性能。


http://www.niftyadmin.cn/n/5043311.html

相关文章

GAN里面什么时候用detach的说明

在生成对抗网络(GAN)中,生成器(G)和判别器(D)通常是两个独立的神经网络,它们之间会有梯度传播的互动。下面是一个简单的GAN的PyTorch实现,用于生成一维数据,以…

「UG/NX」Block UI 从列表选择部件SelectPartFromList

✨博客主页何曾参静谧的博客📌文章专栏「UG/NX」BlockUI集合📚全部专栏「UG/NX」NX二次开发「UG/NX」BlockUI集合「VS」Visual Studio「QT」QT5程序设计「C/C+&#

使用applescript自动化trilium的数学公式环境(二)

9.23 ver1 没想到今天很有精神,在玩chatgpt的时候突然想到,为什么不让他帮我写一份代码呢?说干就干。但是,可能是因为我的英语不怎么样,chatgpt生成出来的整个东西实在是菜的抠脚。所以我觉得还是应该自己先想好一个大…

Crazy Excel:Excel中的泥石流

Crazy Excel又名:疯狂Excel。是一款PC端的Excel软件工具,该软件支持windows, mac os等主流操作系统。 正如其名,作者在设计之初就加入了一些疯狂的设计,目的是创作出更加好用有效的excel工具。 不管是专业还是小白,…

webpack常用配置与性能优化插件

webpack是一个流行的前端项目构建工具(打包工具),可以解决当前web 开发中所面临的困境。 提供了友好的模块化支持,以及代码压缩混淆、处理js兼容问题、性能优化等强大的功能,从而让程序员把工作的重心放到具体的功能实…

小米笔试题——01背包问题变种

这段代码的主要思路是使用动态规划来构建一个二维数组 dp,其中 dp[i][j] 表示前 i 个产品是否可以组合出金额 j。通过遍历产品列表和可能的目标金额,不断更新 dp 数组中的值,最终返回 dp[N][M] 来判断是否可以组合出目标金额 M。如果 dp[N][M…

服务器怎么启动vue3 构建的dist 服务

服务器怎么启动vue3 构建的dist 服务 服务器启动Vue3构建的dist服务,可以按照以下步骤进行操作: 1.将Vue3项目构建的dist文件夹中的所有文件复制到服务器的静态资源文件夹中,例如/var/www/html/。 2.在服务器上安装Node.js环境,并…

c++ 数组传递

类a 中有个 queue<DetectionResult> save_result_queue[2] ,传给类b,类b中怎么定义和接收save_result_queue 目录 数组queue使用例子 类a 中有 mutex save_result_queue_mutex[2]; ,类b怎么定义和接收 数组queue使用例子 class B { public:B(std::queue<Detect…