高进高维空间系列第一部分——高维球体中所有点都集中在边界上!

当我告诉我的朋友和同学当我想到高维空间时,我会莫名其妙的很兴奋。他们会认为我是一个怪人,但是他们也倾向于用科幻小说来解释“更高维度的空间”,类似于其他维度或平行宇宙。然而,这篇文章将用一些简单的几何概念,那些我们在二维或三维中都很熟悉的东西,但是把它们应用到越来越高的维度中,就会看到一些非常酷而且看起来非常奇怪的结果。

具体地说,我想向你们展示,当我们从一个圆中随机选取的点,从二维到三维(一个三维球体),再到超过100维(一个100维超球体),会发生什么。如果这没有任何意义,请不要担心,我稍后会解释清楚的。

最简单的情况下

让我们从最简单的情况开始,从一个2球中选择随机的点,或者我们通常所说的圆。想象一下,在一张纸上画一个圆,然后用你的笔在这个圆内尽可能随机地点上一堆点。从技术上讲,我将使用Python来生成圆内的点,但是思想是一样的。

我想让大家思考一下这些点的一个特征:它们离圆心有多远。每个圆,都有一个中心。关于空间中的球,球体上的每个点都与其中心等距。中心和外部球体之间的距离是球体的半径。为了简单起见,我们只讨论半径为1单位的球。所以,在2维球(圆)的情况下,我们知道每个点到圆心的距离必须是0到1之间。

我们的直觉告诉我们这些点平均离圆心有多远?具体来说,如果我们用尺子测量中心和每个点之间的距离,然后计算平均距离,会怎么样呢?让我们一起来看看!这是一个以坐标(0,0)为中心的2维球(圆),我们称其为原点,半径为1,随机选取1000个点。

就我个人而言,我的直觉是,点到原点的平均距离是半径的一半,即0.5。这些点均匀分布在圆中,所以我们可以合理地假设,这些点到中心的距离也均匀分布在0和1之间。这似乎很合理,对吧?但它不是!每个点到中心的平均距离是0.67。如果我们仔细想想,就会很清楚为什么平均距离应该大于0.5。让我们想一下圆的面积公式πr^2。一个半径为1的圆,面积等于π,约为3.14。让我们把圆分成两个不同的不重叠的区域:一个是所有点到中心的距离都小于0.5个单位(蓝色),另一个是所有点到中心的距离都大于0.5个单位(红色),如下图:

蓝色区域表示到中心的距离小于0.5的所有点,红色区域表示到中心的距离大于0.5的所有点。我们可以用上面相同的方程计算蓝色圆的面积,圆半径是0.5,面积为π/ 4。因为我们知道整个圆包括红色和蓝色区域,我们可以计算红色区域的面积为3π/ 4。红色区域,即所有点距中心大于0.5个单位,占了圆面积的75%。因此,75%的几率距离中心大于0.5个单位远,25%的几率距离中心小于0.5个单位远。这就是为什么从中心到每个点的平均距离大于0.5。让我们看一下从每个点到圆心的距离的分布,使用直方图:

上面的直方图显示了从中心落在0到0.1单位之间,从中心落在0.1到0.2单位之间直到0.9到1之间的点的百分比。这清楚地向我们表明,远离中心的点多于靠近中心的点。说实话,这与我最初探索高维空间的目标相去甚远,但我认为它强调了一个概念,当我们很快进入高维空间时,这个概念将会很重要,也就是说,即使在一个二维的圆中,离中心远的面积比离中心近的面积大。

好了,既然我们已经讨论了二维圆的最简单的情况,让我们来看看有趣的东西吧!当n从2增加到3、4、5或更高时,从点到n维球体中心的距离会发生什么变化?

什么是四维球?

在我们继续探索高维n球的中心和点之间的距离之前,让我们先来弄清楚对于三维以上的点和球来说意味着什么。我们很清楚二维的情况,它只是圆上的点。我们也相对容易理解三维的情况,它只是三维空间中的一个点在一个三维球的内部,如下图:

3维球体和2维球体一样,只是多了一个维度。也就是说,以原点为中心且半径为1的3维球体表示三维空间中距原点小于等于一单位距离的点的集合。为了计算每个点到中心的距离,我们可以想象使用尺子。然后,我们可以计算点与中心之间的平均距离以及距离的分布。

不幸的是,我们人类无法想象三维以上的空间。在三维之外,我们不能再看到球内的点,也不能再轻易想象用尺子测量点到球中心的距离。但是不要担心,因为这些事情是困难的,甚至不可能想象的事实是乐趣的一部分!在没有视觉辅助的情况下,我们必须求助于我们可靠的朋友——数学。记住,以原点为中心,半径为1的二维球代表了二维空间中距原点一个单位距离内的所有点。同样得,以原点为中心,半径为1的3维球体代表了三维空间中距原点一个单位距离内的所有点。

那么4维球体呢?你可能已经猜到了,一个以原点为中心,半径为1的4维球体代表了四维空间中距原点一个单位距离内的所有点!我想你们中的一些人可能会问自己,“他说的四维空间到底是什么意思?”就像我们可以在二维的纸上用两个坐标表示点,比如(x1,x2);我们可以用三个坐标表示三维空间中的点,比如(x1 ,x2, x3);我们可以用四个坐标来表示四维空间中的点,比如(x1,x2,x3,x4)我们不需要止步于四维球体,我们可以添加任意多个维度。一旦我们超越了三维空间,我们可能无法看到实际的点,但是我们可以用坐标来表示它们,重要的是,我们仍然可以测量它们到原点的距离。

你可能会问,我们如何在三维以上的空间中测量距离?嗯,对于二维和三维,我们讨论了用尺子测量每个点到二维或三维球体中心的距离。不用尺子,我们可以很容易地使用几何学最基本的定理之一:勾股定理。这就是我们用来测量空间中两点之间的距离的方法,或者说是一个球中的一点到球中心的距离。你可能还记得用勾股定理来测量直角三角形的斜边,如下图所示:

在二维平面中,点到球中心的距离实际上是三角形的斜边!

具体来说,a是圆心到点在x轴上的坐标的距离,b是圆心到点在y轴上的坐标的距离,c是圆心到点本身的距离。所以,用勾股定理代替尺子,我们可以计算两点到圆心的距离:

c的另一个名字是点到球中心的欧式距离。因此,我们可以利用勾股定理来计算二维空间中两点之间的欧式距离。三维空间呢?利用勾股定理的推广,计算了三维空间中一点到原点的欧几里得距离。具体来说,如果我们有一个点在三维坐标(x1, x2, x3)上,那么我们可以计算出这个点到原点的距离如下:

我不会细讲细节,但这实际上等同于两次应用二维勾股定理——只要想想如何使用两个二维直角三角形在三维空间中到达一个点。

所以,如果我们想要测量n维空间中原点到点的距离,我们只需要把每个坐标的平方加起来,然后开方,如下所示:

它的另一个名字是欧几里得范数,从原点开始,到目标点结束,它到处出现,包括在一些超级酷的统计方法中。但是现在不要太担心这个。

好的,我们现在理解了以原点为中心且半径为一个单位的n维球体,以及如何测量n维空间中两点的距离。

事情开始变得奇怪

首先,让我们看一下随着维度n的增加,点与原点之间的平均距离会发生什么变化。所以,对于每一个n,从2开始,一直到100,让我们计算球体中所有的点到球心的平均距离。具体地说,我要模拟的随机点在每个n维球体中到原点的距离,然后计算每个维度中的平均距离的。下面是每个n维球体中的点与原点之间的平均距离的分布图。

正如我们前面学到的,我们看到,在二维球体中平均距离约为0.67个单位,但当n增大时,这种平均距离也在增加。在三维球体中,平均距离是0.75个单位,四维中是0.91个单位……100维球体中,平均距离是0.99个单位!这是怎么回事?似乎当维度越来越多时,点似乎集中在球的边界上!因为记住,不管维数是多少,对于半径为1n维球体,从原点到球内任意一点的最大可能距离是1。为了好玩,我们来看看3维球体、10维球体、20维球体和100维球体从点到原点的距离分布。

还记得我们刚开始做圆的时候吗?我们发现,大多数点(确切地说是75%)离原点的距离大于0.5个单位,25%的点离原点的距离小于0.5个单位。当我们进入更高的维度时,找到一个小于0.5个单位的点的可能性变得微乎其微。例如,即使在只有10个维度的情况下,少于0.001%的点离原点的距离也会少于0.5个单位!

让我们暂停一下,思考一下这个问题。在任意高维的n维球体中,体积的绝大部分正好位于球的外边界上。对我来说,这就是所有乐趣所在!我们不能明确地想象这些空间,但它们表现出这样奇怪和意想不到的特征。

在这样的空间里走动会是什么感觉?没有一个点可以离原点超过一个单位,然而几乎所有的体积都以某种方式集中在边界上!那是怎样的世界!

这只是我们进入更高维度空间的奇妙旅程的开始。事情只会变得更奇怪,持续关注我,未完待续!

(0)

相关推荐