组
v = Bz推导出数据向量Z。
为了计划的具体性,我们选择一个矩阵A?Rm?N作为合适的压缩感知矩阵,如高斯随机矩阵。然后我们以这个方法选取矩阵B?Rm?N使n + m = N,它的列
和A的行成正交补,因此保证AB=0.由这些设定,我们可以收集许多和Cm/ln(N/m)一样大的信息错误。
统计和机器学习(能力) 统计回归的目的是根据确定的输入数据预测结果。一般选用线性方程y=Ax+e,其中A?Rm?N—一般称之设计或预测矩阵—收集输入数据Y表示输出数据,e表示
一个随机噪音向量。
向量X是一个需要从数据中估计的参数。在一个统计结构中,一般使用标记法(n, p)代替(m,N),但我们保留下后一个以保持连贯。
在临床研究中,举例来说,输入Aj,k可能指第j位病人那一行的血压、体重、身高、基因数据,表示一定的特征,等等。对应的输出
可能是另一个相关量,
例如,第j位病人得某种病的可能性。有了m位病人的数据,回归目标是要适合于模型,也就是说定下参数向量X。
实际上,参数N的数量远大于观测数量m,所以即使没有干扰,在没有更多假设的情况下是无法解出适当的参数X的。然而在许多情况下,只有一小部分参数对预测做出贡献,但是这些有影响的参数是推理出来的未知数。这导致了向量x稀疏,再一次我们得到了标准压缩感知问题。统计项中,定下一个稀疏参数向量相当于选择相关解释变量,也就是x的支集。这也会涉及模型选择。
这本书中提到的方法也适用于这种情况。然而,这种情况与噪声向量e的随机性一般步骤存在轻微的背离。特别是,不同二次约束一般考虑称之为LASSO(最小绝对收缩选择算子)
最小化问题(1.4),
对一个适当的正则化参数τ,其依赖于噪音的变化。更多的变化称之为丹齐格选择
或择λ。
规则化问题(有时候叫做LASSO或基追踪降噪)再一次为了适合的选
我们将不再关注统计背景,但是我们简单的提及接近最优统计估计特征可以在A情况下,在LASSO和丹齐格选择中同时展现。它和下一章中的问题类似。
在机器学习中出现一个密切相关的回归问题。给予任意随机的样本
其中tj是一些输入参数向量同时yj是一个标量输出。我们希望从接下
来输入数据t中预测输出数据y。将输入t和输出y联系起来的模型是
y=f(t)+e
其中e表示随机噪音。目标是通过培养信号
来获得函数f。没有有关
f的更多猜想,这将是一个不可能的任务。因此,我们假设f在已知的函数ψ1,. . . , ψN
的程序库有一个稀疏扩大,也就是说函数可以写成
其中x是一个稀疏向量。提出输入为
的矩阵A?Rm?N 我们获得模型y=Ax+e,目标是为了估计稀疏系数向量x。这和上面提到的问题有同样的构造,相同的评估程序包括LASSO和丹齐格选择应用。
低阶矩阵还原和矩阵完成
最后,让我们通过它的一些应用讨论下压缩感知的扩展。不局限于还原一个
稀疏向量x?CN,我们现在将目标瞄准一个不完全信息的矩阵X?Cn1?n2。假设一个有低阶的稀疏度x。实际上,相比所有的矩阵集,给予矩阵低阶集,使之略微复杂对还原矩阵来说更有理。
对于线性图A:X?Cn1?n2→Cm ,m 阶。最单纯方 是非确定性多项式复杂问题,但是压缩感知问题与其相似也有所帮助。 为了论证这种相似,我们考虑x的奇异值分解,也就是 这里 是x的奇异值,而且 分别是左右奇异向量。我们参考附录A.2详情。矩阵是r 阶的,有且仅有向量 的奇异值是r级稀疏也就是 阶。想到有l1最小化方法求压缩感知,很自然的就引入一种核范数作为l1-norm 的奇异值,也就是 接下来我们考虑核范数最小化问题。 这是一个可以被高效解决的凸形最佳问题,例如,半定程序再成型。 一个非常类似于稀疏向量还原的理论可以被发现,A的合适条件确保通过核范数最小化的精确和逼近还原(和其他算法)。再一次,随机图片出现最优,在 m?Crmax{n1,n2}情况下,矩阵最高阶r可以从m测量值中得到很高的可能性还原。 这种边界是最佳的,因为右方自由度数足以描述一个r阶比向量形式,这里明显没有涉及对数因数。 矩阵。相 作为一种普遍的特殊情况,完全矩阵问题变为填充失去的低阶矩阵项问题。测量图A为指数j, k取一些相关l的项 。这个计划显现,例如, 在消费者品味预测中,假设在一个(线上)商店出售物品以矩阵行检索,消费者以矩阵列检索,可以估价这些商品。并不是每一个消费者会估价每一个商品,所以矩阵只有有限的元可用。为了个性化广告的目的,商店对预测整个估价矩阵感兴趣。一般,如果两个消费者都喜欢一些商品的子集,则他们将也会喜欢或不喜欢其他商品的子集(消费者的类型基本上是被限制的)。由于这个原因,可以假设,估价矩阵具有(至少近似的)低阶,它可以被经验证明。因此,地阶矩阵还原方法,包括核范数最小化方法,可以运用于这种假设中。 虽然很感兴趣,但是我们并不准备在本书中对低阶还原进行延伸。然而,考虑到其与稀疏还原紧密联系,主要结果在练习中有所涉及,读者有兴趣可以自己解决这些问题。 压缩感知 本章介绍了标准压缩感知问题,给出了这本书内容的概括。由于实际问题很大程度上推动了数学理论,我们也简单的讨论了一些可能的应用。 什么是压缩感知? Ax = y. (1.1) 在许多科学技术方面的实际问题中,一旦遇到任务要求对量测信息进行推断,例如,在信号图像处理中,可能要从实测数据中重建信号,当信息获取过程呈线 my?C性时,问题便简化为求解线性方程组了。用数学术语表达,观测数据通过 AX=Y(1.1)连接到目标信号X?C。 矩阵A?Cm?NN建立了线性测量进程的模型。然后通过求解上述线性方程组来 重建向量X?C。传统观点认为,测量次数m,即,测量数据量,至少和信号长 N 度N(X组分的数量)相等。 目前的技术中,大多数设备的使用都是以此原则作为基础,如模拟数字转换,医学影像,雷达,以及移动通信。事实上,如果m < N,经典的线性代数显示线性系统(1.1)是欠定的,且有无限多的解决方案(当然,存在至少一个)。 换句话说,没有额外信息的话,在m < N的情况下,是不可能从y中重新获得x的。 这个事实也涉及香农采样定理,即为了确保重建数据连续时间信号的采样率必须是最高频率的两倍。 图1.1安东,尼尔斯,和琳娜。 上图:原始图像。下图:使用1%的绝对值最大的小波系数重新构图,即,99%的系数被设置为零。 因此,它是一个令人惊讶的某些假设,它实际上是可能的重构信号时,可用的测量值的数目M小于信号长度, 更令人吃惊的是,高效的算法确实存在于重建中。稀疏性使所有这些深层次的假设成为可能。这一现象相关的研究领域被称为压缩感知,压缩感知,压缩采样,或稀疏恢复。这整本书是致力于这一领域的算法基础。