https://www.scientificamerican.com/article/the-mathematics-of-how-connections-become-global/

算出人与人的连结

渗流理论阐明许多网络现象,从手机通讯到病毒扩散

当你写完短信按「送出」后,很容易以为短信是从你的手机直接传送到朋友的手机。但其实你的短信通常通过手机网络或互联网(Internet)绕一大段路,这两类网络都依赖集中式基础设施,可能因自然灾害而损毁或受专制政府阻断互联网。由于担心国家的监控或干预,精通科技的香港抗议者便回避使用互联网,改用 FireChat 和 Bridgefy 这类应用程序,直接把信息发送到邻近的手机上。

这些应用程序让信息从手机无声无息地跳到另一支手机,把发件人和收件人(唯一能检视这则信息的使用者)连结起来。这种手机连结的组织型态通常称为网状网络(mesh network)或移动式特定网络(mobile ad hoc network),展现一种既灵活又去中心化的通讯模式。不过无论如何,任两支手机若要彼此通讯,还是必须通过其他手机的串接才能连结。因此问题便是,分散在香港各地所连结起来的同一网状网络,必须要通过多少人串接,才足以能建立横跨城市的通讯?

数学一门称为「渗流理论」(percolation theory)的分支提供了令人惊讶的答案:只要区区几个人就能让情况大异其趣。刚开始,随着用户加入新网络,孤立的手机连结区块会逐渐成形。至于由西至东、跨越南北的全面通讯,则会在用户密度超过特定的临界值时突然浮现。科学家把这种网络连结程度的剧烈变化称为「相变」(phase transition),与用于解释冰融化、水沸腾这类物质状态突然转变的物理概念类似。

渗流理论探究在这类网络中随机建立或移除连结的后果,数学家把这种网络设想成一堆「节点」(node,以点表示)的组合,并以「边」(edge,以线表示)连接。每个节点表示某种对象,例如手机或人,每条边则是两节点之间的特定关系。渗流理论出现于 1950 年代,基本洞见认为随着网络连结的数量增加,节点彼此连通的整体群簇(cluster)将会遽然突现(emergent)。

科学家试图回答的问题是「何时发生?」,对于任意给定的网络,相当于 0℃ 冰融化或者 100℃ 水沸腾的那个临界时刻是什么?什么时候迷因(meme)会爆红?产品何时会垄断市场?地震何时会发生?手机网络何时会全面连通?疾病何时会大流行?渗流理论为所有这些相变提供了洞见。

数学家研究的典型对象是理想化的网络:具备几何对称性且范围无限,如此一来才比较能进行理论计算,而通常唯有在无止尽网络上才存在真正剧烈的相变。即使现实世界的网络范围有限,而且通常很紊乱,需要运用计算策略来克服难题,但是现实网络也有相变,只是没这么剧烈。由于我们的世界通过各种复杂层级的连结变得益发紧密:交通运输了人群、电网提供了能源、社群媒体联系了个人、社交网络散播了疾病,因此关于渗流理论的研究反而变得更加切身。

网络连通

1957 年,英国数学家布罗德本(Simon Ralph Broad-bent)和汉默斯里(John Michael Hammersley)把化学的渗流研究抽象化,首次把渗流理论架构成一个纯数学问题。化学家研究石油流渗多孔岩层或水渗入咖啡粉等流体渗透材料的过程,而岩层的渗流网络由岩层结构中的小孔(节点),以及容许流体在其间流动的槽道或裂缝(边)所组成。显而易见的是,石油在碎裂程度大的岩层中可以渗流得更远。布罗德本和汉默斯里运用渗流理论预测,在理想的岩层里,一旦裂缝密度超过特定临界值,石油会从只流经小区域,突然转变为渗透几乎整个岩层。

地质学家运用渗流理论的某个版本,研究断裂岩层中裂隙群簇的大小,这项研究与采用液压破裂法开采石油或地震的发生都有关联。地震学家为了替地震建模,建立了与实际观测的裂隙规模和密度相吻合的渗流网络,并调整裂隙连结的概率来解释应力。随着应力和连结的增加,裂隙群簇会扩大,直到不可预测的地震突然间爆发。有些建模渗流过程的调整版本,容许裂隙的粘合与再次碎裂,则可用于模拟余震或长期变化。

渗流理论也能阐明规模小得多的物理化学过程,例如聚合(polymerization):所谓单体(monomer)的简单小分子结合在一起,形成了聚合物(polymer)的群簇。在渗流理论的架构里,单体就是节点,邻近单体可能会自发形成的键结就是「边」。如果单体彼此连结的可能性增加,系统最终会达到渗流临界值,于是连接的巨大聚合物就会突现,这就是粉状明胶(俗称吉利丁)溶于水,最终形成「果冻」的机制。

断裂岩层或聚合物连结的网络极其复杂,想要精确描述结构是几乎不可能。但是布罗德本和汉默斯里说明,可以通过容易分析的重复模式来逼近预测结果,其中最简单的例子是正方格(lattice),它看上去就像无止尽的格纸,其中格点就是节点,并以四条边连结邻点。

要理解流体如何在这个格网中流动,想象格纸上的每条细边是一条或开或关的水管,可以掷硬币决定水管的开关状态,掷出正面就「打开」,掷出反面就「关闭」。这样的管道开关系统便是一个随机网络,而且会出现一些连通群簇,其中的所有节点可通过一连串的连通水管彼此连接。如果把水倒入群簇中的任一节点,便可通过连通的水管流到群簇的其他节点。

渗流理论关心的是网络的连通性,相对应的便是连通群簇有多大?但是「大」是一个模糊的概念,不容易以数学的形式语言处理,所以数学家经常用「无限」来取代「大数」。于是核心问题变成是否存在无限大的群簇?德国柏林维尔斯特拉斯应用分析和随机性研究所的数学家贾奈尔(Benedikt Jahnel)说:「对我们来说,比起回答不同大小的网络中能看到多少个大型群簇,回答是否有无限大的群簇要容易得多。」

事实上,无限网络具有无限群簇的概率总是 0 或 1。这是因为渗流过程受制于称为 0-1 律(zero-one law)的概率论一般原理,由俄罗斯数学家科莫格洛夫(Andrey Kolmogorov)在 1930 年代发现的。假设掷硬币无数次,0-1 律适用于某一类问题──只要答案与有限次抛掷结果是无关的,例如「是否会出现无穷次正面?」的答案不会因更动有限次的抛掷结果而改变,但「是否第三次会掷出正面?」的答案却可能只因为更动一次抛掷结果就会不同。

0-1 律告诉我们,有限的变化不能干扰本质是无限的现象。所以在无限网络中,找到无限群簇的概率不会有微小的改变,例如从 0.81 变成 0.82,它的概率必须是很极端的 0 或 1。换句话说,一个无限网络要嘛没有无限群簇(找到无限群簇的概率为 0),不然就有无限群簇(概率为 1)。

因此,把有限的连通水管关闭或者打开,对是否存在无限连通群簇的答案没有任何影响。找到无限群簇的概率要么是 0,要么是 1。问题在于,究竟是哪一个?

寻找临界值

答案取决于这枚硬币的偏向(bias)。想象有一台控制硬币偏向的刻度盘,把旋钮往左转到底,硬币就总是掷出表示「关闭」的反面。一旦所有水管都关闭,倒入节点的水就哪里都流不出去,找到无限连通群簇的概率便是 0。假如旋钮往右顺时针转动,硬币掷出「打开」的概率增加,因此随着抛掷的次数增加,连通的水管会越来越多。把旋钮往右转到底,硬币总掷出正面,倒入某一节点的水最终就能流到其他任何节点,此时找到无限群簇的概率是 1。

如果顺时针慢慢转动旋钮,水管连通的概率逐渐增加,出现无限群簇的概率似乎也应该从 0 逐渐增加至 1。但基于 0-1 律,概率不可能是 0 和 1 之间的某数,因此概率的变化事实上是瞬间发生。对于正方格来说,当旋钮转到正中间,也就是公平硬币的状况,出现无限群簇的概率就会从 0 突然变成 1。这个旋钮的关键位置称为渗透临界值。无论网络的形状是三角格、还是立方格,渗流理论的基本问题都一样:临界值是多少?硬币的偏向要有多大,才会打开足够的连结,确保出现无限的连通群簇?

答案取决于(无限)网络的确切形状,而且通常很难解答。即使证明最简单的正方格临界值是 1/2,也是极大的挑战,直到 1980 年才由美国数学家凯斯登(Harry Kesten)解决。尽管经过数十年的努力,依然只知道少数极简单网络的渗流临界值。美国密歇根大学的统计物理学家齐夫(Robert M. Ziff)说:「仅仅是寻找临界值的研究就汗牛充栋,科学家曾检视过不同系统,其数量真是令人瞠目结舌。」齐夫用一则维基条目的篇幅,记录了数百个网络的渗流临界值。三角格的临界值大约 0.347,是经分析证明的数值,但该页面上绝大部分的数值(包括立方格的临界值)都是借由电脑模拟得出的近似值。

现实网状网络

在物理系统之中,格网是很好的渗流模型,例如在断裂的岩层里,孔洞的位置是固定的,孔洞之间的裂隙则是随机形成。但是现实世界的其他网络复杂得多,例如前文所提到的 FireChat 和 Bridgefy 网状网络,节点(香港抗议者携带的手机)的位置会不断更动。

这类网络的边(或连结)是在两支手机够近的情况下才形成,以这类分享信息的蓝牙应用程序来说,大概是数十米的范围。这类网络必须采用称为连续渗流(continuum percolation)的不同模型来描述,因为网状网络的节点可以位于连续空间内的任何位置。

和任何数学模型一样,这类网络也是基于简化的假设。智能手机随机散布各处,并未模仿地图里的人群自然群聚和移动模式,两支智能手机的连结与否只和彼此的距离有关,并不考虑墙壁或其他阻碍。虽然如此,这类模型还是凸显了渗流理论在研究现实网状网络时的核心功能。有两种方法可以增加连续渗流网络的连结程度:容许在更远的范围内产生直接连结,或者是增加更多手机,进而提高用户密度。这些修正也可以采用前述水管网络的刻度盘来描述,就像有两个调控的旋钮,顺时针转动任一个旋钮都会增加连结程度。贾奈尔指出,在这些模型中「都有一个临界值,可以调控从局部到整个区域的连结程度。」

对设计网状网络应用程序的工程师来说,找到渗流临界值是很实际的工程问题。其中一种转动旋钮的方式,就是改变装置控制范围的功率。网状网络公司 goTenna 的首席科学家拉曼纳桑(Ram Ramanathan)表示,关键问题就是「让网络连通所需要的传输功率是多少呢?」如果功率和连结程度是线性关系,答案就非常简单,每增加一点功率就相应增加等比例的连结程度。但是渗流临界值的存在则代表,当人群四处移动,网络就有突然消失连结的风险。因此能确保网络能始终连通却又不浪费能量,就是最佳功率。

另一个旋钮调控手机的密度。固定连结范围的网状网络需要一个用户的临界密度,尽可能在音乐节、足球比赛或大型示威这类拥挤活动中提供广泛的连通网络。Bridgefy 执行长兼共同创办人里欧斯(Jorge Rios)表示,该公司在喀什米尔、尼日利亚、香港或伊朗动乱期间,看到大量的新用户尖峰,当时人们转向运用网状网络维持通信,以防政府关闭互联网或大量人群塞爆手机通话。

有些社区例如美国纽约布鲁克林的红钩镇(Red Hook),正运用网状网络的特性,借由把永久节点固定在建筑顶端来扩大互联网的连通。尽管许多必要的硬件和路由科技仍在持续发展中,但很容易就能设想出大胆又新颖的应用方式,例如自动驾驶车可以彼此直接通讯,分享交通模式或行车事故的信息,无需仰赖任何额外的基础设施。

疫情因应策略

用于建模岩层石油流动或手机直接通讯的网络,模拟了这些系统的真实空间结构:如果两节点所代表的事物在物理空间中靠近,就用一条边连结起来。但追查疾病传播网时,连结与否取决于特定病菌在人群传播的方式。这类网络特别紊乱,一个带原者在大城市的夜店待了一小时,就可能把病毒传染给另一个人,后者在几天内能把病毒跨国甚至跨洋传播出去。

最简单的流行病学模型把人分成未感染者、感染者和康复者三类,却忽略前述的连结复杂结构。在这类模型里,感染者随机把病菌传染给未感染者,并假设该群体中的每个人,例如宿舍的学生或城市的居民,感染的概率都相等。未感染者的感染率取决于基本传染数(basic reproductive number, R0),亦即单一感染者所传染的新患者平均数。如果 R0>1,病毒便会扩散,R0<1,则疫情会逐渐消失。

但是人与人的互动其实会影响疾病的整体传播。例如,2003 年爆发的严重急性呼吸道综合征(severe acute respiratory syndrome, SARS),最初的 R0 值介于 2.2–3.6,但是现任职于美国德州大学严重特殊传染性肺炎(COVID-19,简称新冠肺炎)建模联盟主任的麦尔斯(Lauren Ancel Meyers)在 2006 年发表的论文中指出,当时的确诊数「远低于根据简单计算的预测」。她认为这项差异源自「所有未感染者都有相等感染概率」的假设,忽略了人群社交网络的复杂型态。当时 SARS 的 R0 估计值是基于它在公寓大楼和医院内快速传播的数据,这些地方「人与人之间的密切互动比率异常高」。但因为感染 SARS 的人很快就病得很重,可能尚未传染给其他人,就已经就医。

疾病传播网的「边」表示特定关系。例如,在艾滋病毒潜在传播网里,两个人(节点)如果体液交流就以「边」连结起来。但是在新冠肺炎潜在传播网里,边的结构非常不同,代表的是未保护呼吸道的密切互动。封锁或管制措施例如停业或旅游禁令,改变了边的结构,再加上配戴口罩并保持社交距离,更能防止新型冠状病毒从一个人(节点)连结到另一个人。流行病学家的挑战则是找到充份截断传染链的方法。

现实世界之中的疾病传播网,例如新冠肺炎潜在传播网,是极为复杂而难以明确描述的。而且就算知道网络的确切结构,想用数学来进行分析也是巨大挑战。于是科学家改用电脑模拟并分析巨量资料来预测未来确诊数、评估保持社交距离一米或两米的影响,并量化研究学校和餐厅在新冠肺炎传播网中的重要性。美国东北大学的复杂网络学家威斯皮纳尼(Alessandro Vespignani)比喻这项研究是「战时」工作,只具战术意义又常显混乱,却必须即时提供政策制定者与医疗照护人员所需的数值结果。威斯皮纳尼表示,自己和同事打造了「一种人造社会,把所有个人的互动打包到一台电脑里」来模拟。

相较之下,威斯皮纳尼把自己的「平时」研究比喻成「发展模型,推敲不同建模方法、开发特定策略、检视如何改善研究结果」的时期。为了从理论上理解网络的基本型态和结构特征如何影响疾病传播,科学家转向渗流理论寻求灵感。

以传统纸笔数学研究渗流理论的工具只适用于最简单的情况,所处理的是人工有序的对称网络。即使如此,威斯皮纳尼说:「以数学指引我们的理解,还是非常紧要。」网络流行病学家把网络去芜存菁,特别关注网络的「度分布」(degree distribution)。所谓的「度」是指特定节点所连结的其他节点数,例如在正方格中,所有节点的度都等于 4。然而在疾病传播网中,度的分布差异很大:有些人接触了很多人,就可能把疾病传播给很多人,但是也有人相当孤立。

度分布描述了一个节点是几度的概率。在疾病传播网里,度分布相当于一个人可感染(或被感染)几个人的可能性。为了理解这个面向如何影响渗流临界值,麦尔斯等数学流行病学家近乎随机制造出数千个样本网络,只保留具备相同度分布的特性。这套方法可以把度分布的因素隔绝起来,进而理解度分布在网络结构中的角色。如果生成网络的属性与现实世界网络相合,那么度分布或任何其他被「植入」数学模型的特性,就可能与疾病传播相关。麦尔斯指出,如果能完美匹配,「那么你的数学预测结果看上去就会跟模拟一样。」

有研究显示,如果网络的度分布较广,也就是节点的度分布范围较大,那么网络的渗流临界值就会下降。所以,比起每个人接触人数大致相同的网络,在一个有些人与他人广泛互动、有些人十分孤立的网络中,疾病相对容易传播。澳大利亚墨尔本拉特罗布大学的数学流行病学家米勒(Joel Miller)用启发式的说法解释这项观察:「如果我的接触人数比你多 10 倍,我被感染的概率就是你的 10 倍,感染别人的可能性也是你的 10 倍。因此对疾病传播网来说,我有 100 倍的重要性。」

网络的关键转变

学者用渗流理论来建模其他「感染」现象,例如社群媒体上的迷因先是慢慢取得关注,直到突然爆红。这套理论也可以应用于经济模型,显示某特定产品如何因为人们在生活圈分享推荐后快速垄断市场。另外,例如人们影响其社群的选民模型,也显示出临界点效应。

与传统数学家研究的无限又精微有序的网络相比,现实世界的网络是有限而混乱。有限网络不像无限网络,能从小范围的连结瞬间跃升到无所不在的连结,但通常也有非常迅速转换的特性。为了理解这些过程,网络学家得在数学与电脑模拟之间转换。先以较简单的网络引导他们建立现实网络的详细电脑模型,从中学习到的经验又可以回头改善纸笔模型,以取得对现实世界的洞见。

许多有关新冠肺炎传播的重要网络模型,整合了其他网络的资讯。学校系统、火车路线和医院员工的排班时程都是网络,每一项都影响疫情的进展。美国加州大学戴维斯分校的复杂网络学家德索扎(Raissa D'Souz)说:「我们生活在网络相互依赖的体系中,不能只考虑单一网络,不去理解其他网络的效应。」每个网络都是自己的复杂系统,也都具有自己的突现行为。科学家逐渐把这些网络连接起来,制造出更复杂的系统。但想要研究这类网络的网络,目前还没有清楚的理论架构。理解它们的特性如何受到其组成网络性质所影响,将是未来的挑战。

威斯皮纳尼说:「我们既不是活在泡泡里,也不是在充份混合的世界。我们生活在相互连结的世界,我们会关注推特用户,这些正是渗流理论或其他模型可以派上用场的地方。」现在如果能更理解这些理论数学模型,「就可以在未来有所作为。」渗流网络很容易改编使用,既为数学家提供新研究,也为科学家提供实际应用。但是这些差异颇大的模型共享一个令人惊讶的特色:它们都有一个敏感的支点,只需新增几个连结就能把整个网络连结在一起。由于当今世界的人际网络连结日益紧密,理解疾病传播网关键转折的必要性变得更日益迫切

Laminar flow

我们应该学会去理解别人的观点,不仅仅是服从和被告知。

Project Che

我们应该学会去理解别人的观点,不仅仅是服从和被告知。

我们应该学会去理解别人的观点,不仅仅是服从和被告知。
我们应该学会去理解别人的观点,不仅仅是服从和被告知。
时代的水流漫过了每一只筏子,浸湿了我们的脚,而大雨迟早要来。

开门见山,明知山有虎

所有火中取栗、蹈火赴汤和洞若观火的报道,都是易燃品。

Continue Reading