https://www.wsj.com/articles/covid-19-gene-data-that-could-have-aided-research-on-early-epidemic-removed-from-database-11624472105

美国称中国科学家曾要求删除新冠病毒数据

这些消失不见的基因序列不太可能改变研究人员对新冠疫情在武汉出现的最初几周的现有理解,但删除这些基因序列使人们对中国在新冠疫情溯源方面的透明度产生怀疑

美国官员证实,已应中国科学家的要求,删除了美国一个数据库中可能有助于了解新型冠状病毒肺炎(Covid-19,即 2019 冠状病毒病)起源的记录。

2020 年 3 月,一个来自武汉的学者团队向美国的一个档案馆提交了导致该疾病的病毒的序列。武汉是最早报告新冠肺炎确诊病例的城市。然而美国国家卫生研究院(NIH)周三表示,3 个月后,该学者团队要求删除这些序列,相关数据因此被删除,这证实了美国生物学家杰西・布卢姆(Jesse Bloom)的调查结果。

美国国家卫生研究院在声明中说:「提交数据的调查人员对他们的数据保有权利,可以要求撤回数据。」

遭删除的数据并不能证明新冠病毒一开始是如何感染人类的,无论是通过动物还是通过武汉病毒研究所(Wuhan Institute of Virology)的实验室泄露。但专家表示,这进一步显示出中国研究人员和官员在处理与新冠疫情起源有关的数据方面没有做到完全透明。

罗格斯大学(Rutgers University)化学生物学教授理查德・埃布赖特(Richard Ebright)说:「这些发现并不能直接阐明疫情起源问题。这些结果没有排除自然起源的可能性,也没有排除实验室泄露的可能性。」

但他补充称:「(它们确实)提供了证据,表明 2019 年秋季武汉出现新冠病毒(SARS-CoV-2)时存在故意混淆早期事件的情况,以及存在故意妨碍调查这些事件的情况。」

自疫情开始以来,科学家一直在试图弄清病毒起源,以防再次爆发类似疫情。但是,尽管大多数科学家认为这种病毒是从动物传染给人类,但他们无法确定是哪种动物从蝙蝠身上沾染了这种病毒,并将其传染给了人类。

美国前总统唐纳德・特朗普(Donald Trump)认为该病毒是从武汉实验室泄露出来的。该实验室是全球领先的蝙蝠冠状病毒研究中心之一。中国否认了这一说法,但最近几周,随着美国总统乔・拜登(Joe Biden)命令其情报官员今年晚些时候得出自己的结论,这种说法在美国得到了支持。

关于疫情起源的大部分调查都集中在去年年初从武汉的患者身上采集的病毒样本上,由世界卫生组织(WHO)组建的一个小组进行调查。这个调查小组称病毒「极不可能」来自实验室泄露,但世卫组织表示调查不够广泛。

西雅图弗雷德・哈钦森癌症研究中心(Fred Hutchinson Cancer Research Center)病毒学家布卢姆表示,新冠病毒的其他基因组序列是 2020 年 1 月至 2 月从武汉患者身上提取的,是武汉大学(Wuhan University)研究人员尝试改进新冠病毒检测的一部分。

这些样本被美国国家卫生研究院记录了下来,但布卢姆自己调查疫情起源时却没有找到。

然而,布卢姆意识到这些数据并没有从谷歌云(Google Cloud)删除后,设法找回了大部分数据。他表示,缺失的序列并不能证明有关疫情起源的任何说法,但确实表明新冠病毒在武汉传播的时间比中国当局迄今承认的要长。

武汉大学没有回应置评请求。

https://www.ft.com/content/b53661d6-a70a-44ca-92a7-fa2fa4944d52

美国应中方要求删除新冠基因序列,病毒溯源难度加大

中国研究人员曾要求美国国立卫生研究院 (National Institutes of Health, 简称 NIH) 从一个关键科学数据库中删除早期新冠病例的病毒基因序列,此举让人担心研究疫情起源的科学家可能无法获得关键信息。

NIH 证实,应一名中国研究人员的申请删除了这些序列。这些序列是该人员提出这一申请前三个月提交的。该研究院在一份声明中说:「提交数据的研究人员拥有对其数据的相关权利,并且可以要求撤回数据。」

西雅图福瑞德哈金森肿瘤研究中心 (Fred Hutchinson Cancer Research Center) 的病毒学家布卢姆 (Jesse Bloom) 周二在网上发表的一篇新论文中描述了上述测序数据删除的情况。这篇尚未经过同行评审的论文称,删除的数据包括 2020 年 1 月至 2 月期间在中国武汉市收集的新冠肺炎住院患者或疑似病例的病毒样本中提取的病毒序列。

布卢姆表示,一些被删除的信息仍可以在一篇发表在小型期刊上的论文中找到,但科学家通常会在一些主要数据库中寻找基因序列,比如 NIH 维护的数据库。

这些消失不见的基因序列不太可能改变研究人员对新冠疫情在武汉出现的最初几周的现有理解。但布卢姆称,删除这些基因序列使人们对中国在新冠疫情溯源方面的透明度产生怀疑。

其他一些科学家对此表示认同。

匹兹堡大学 (University of Pittsburgh) 进化生物学家库珀 (Vaughn S. Cooper) 称:「此举不禁让我们怀疑,是否还有其他像这样的基因序列已被删除。」库珀没有参与这篇新论文的工作,并表示他本人也没有对被删除的序列进行过研究。

新冠病毒全球大流行一年多以来,科学家和政客们仍在争论这种病毒的源头何在。《华尔街日报》回溯了发生在中国一个海鲜市场、一个病毒实验室和一个山区铜矿的关键事件,以拼凑出这场全球健康危机起源的部分可能性。

为了追溯新冠疫情的源头,科学家们需要获得可揭示新冠病毒是如何进入人类群体并开始传播的信息。从数据库中删除信息会使科学家更难找到此类信息,这可能会减缓他们的研究速度,就像无法获得其他研究信息那样。由世界卫生组织 (World Health Organization, 简称 WHO) 领导的一个国际专家组以及其他科学家正在调查新冠疫情的源头。

根据 NIH 的声明,之前提交该病毒基因序列的科学家们曾在 2020 年 6 月要求删除这些数据,理由是该基因序列数据已被更新,并将发布到另一个数据库,未详细说明具体哪个数据库。据 NIH 称,这名研究人员说,为了避免信息混淆,他们希望 NIH 删除这个旧版本的基因序列数据。

据 NIH 称,中国研究人员最初在 2020 年 3 月向 NIH 数据库提交了新冠病毒基因序列,并在一个预印服务器上的一篇论文中发表了有关这些基因序列的信息。该论文描述了使用一种先进的测序技术来检测 SARS-CoV-2,即导致 2019 冠状病毒病 (Covid-19) 的病毒。上述研究人员没有立即回应记者的置评请求。

中国国家卫生健康委员会没有立即回应记者的置评请求。

布卢姆在周二发表的论文中说,科学家们在研究新冠病毒起源方面所面临的一个挑战是,缺乏有关武汉早期病例的数据。他说,这些数据主要限于 2019 年 12 月从武汉华南海鲜市场有关的十几名新冠患者身上获得的病毒基因序列,以及 2020 年 1 月底之前收集到的少量额外基因序列数据。武汉华南海鲜市场是已知的第一个暴发新冠疫情的地点。

删除这些序列导致「早期病毒在武汉传播的情形有些被扭曲」,布卢姆说,「这表明,我们没有看到更多这些序列的原因之一可能是有关方面没有真心实意地努力要把它们拿出来。」

布卢姆论文的发表可能会助长要求中国在全球新冠溯源的努力中加强合作的呼声。

与筹备了 WHO 3 月份新冠溯源研究报告的国际专家组进行合作的一位 WHO 官员称,布卢姆的论文并没有从根本上改变该专家组对早期疫情的理解,但确实提醒人们应该加强对最早期新冠病毒感染的分析。

《科学》(Science) 杂志 5 月份发表了布卢姆与他人共同撰写的一封信,该信批评了 WHO 的这份报告,并呼吁对新冠病毒起源的两个主要假说进行更深入调查:一种假说是,导致这次大流行的病毒从实验室泄漏后进入了人类群体;第二种假说是,该病毒从受感染的动物身上自然传到人类身上。

他说,当他阅读了其他研究人员的分析报告并尝试自己找到这些序列时,他意识到这些序列已经从 NIH 的 Sequence Read Archive 数据库中删除了。

发现这个问题后,他利用早上和周末的时间在互联网上搜寻这些被删除序列的其他来源,最终找到并下载了下来。然后布卢姆联系了 NIH,询问这些序列为什么被删除了。

匹兹堡大学病毒学家库珀说,被删除的序列并不能解决一个持续的争论,即疫情是由实验室事故引起的,还是由动物传染给人类的。他说:「你仍然可以从两个方面来论证。」

但天普大学 (Temple University) 生物学教授庞德 (Sergei Pond) 称,布卢姆的论文表明仍可能会出现其他早期序列数据。庞德的专长是病毒病原体进化研究。

「如果有更多的序列出现,特别是来自早期时间点或者其他地方的档案样本的序列,一切都可能再次改变,」他说,「我认为这很可能会发生。」

没有参与布卢姆研究的犹他大学 (University of Utah) 进化病毒学家戈尔茨坦 (Stephen Goldstein) 称,目前还不清楚能否从删除的序列中获得新的见解。他表示:「从科学的角度来看,我不认为这些指向任何恶意目的。」他还称,自己没有对这些序列进行过分析。

加州大学圣迭戈分校 (University of California, San Diego) 的进化生物学家沃特海姆 (Joel Wertheim) 说,被删除的序列是片段,「完整的基因组序列通常才是最有价值的」。沃特海姆最近撰写了一篇有关疫情早期情况的论文。

布卢姆在自己的论文中表示,即便不进一步进行国际调查,他所采取的方法也可以用来更多地了解新冠病毒起源或早期传播。

他表示:「我们真的需要努力寻找,看看是否还有其他关于尚未被发现的序列的早期信息。」他称:「我打算翻阅我能够找到的关于新冠病毒的每一份早期预印本,看看其中是否描述了数据库中没有的数据。」

https://www.nytimes.com/2021/06/23/science/coronavirus-sequences.html

科学家发现曾被神秘删除的早期病毒序列

大约一年前,来自武汉新冠早期病例的 200 多个病毒样本的基因序列从一个在线科学数据库中消失了。

现在,西雅图的一位研究人员报告说,通过对存储在谷歌云上的文件进行分析,他已经恢复了其中的 13 个原始序列——这是一个有趣的新信息,可以用来识别病毒可能是何时,以及如何从蝙蝠或其他动物传播到人类的。

周二发布的新分析支持了早些时候的说法,即在 2019 年 12 月与生鲜市场有关的最初疫情暴发之前,多种冠状病毒可能已经在武汉传播开来。

目前拜登政府正在调查这种名为 SARS-CoV-2 的病毒的有争议来源。这项研究既没有加强,也没有否定病原体是从武汉一家著名实验室泄露出来的假设。但它确实提出了一个问题,那就是原始序列为何被删除,并表明可能有更多信息可以从互联网的偏远角落恢复。

没有参与这项研究的亚利桑那大学(University of Arizona)进化生物学家迈克尔・伍罗贝(Michael Worobey)说:「这无疑是一项伟大的侦查工作,它大大推进了了解 SARS-CoV-2 起源的努力。」

撰写这份新报告的弗雷德・哈钦森癌症研究中心(Fred Hutchinson Cancer Research Center)的病毒学家杰斯・布鲁姆(Jesse Bloom)称,这些序列被删除是可疑的。他在文中写道,「删除这些序列似乎是为了掩盖它们的存在,」该论文尚未经过同行评审或发表在科学期刊上。

布鲁姆和伍罗贝属于一个直言不讳的科学家团体,他们呼吁对大流行如何开始进行更多研究。在 5 月发表的一封信中,他们抱怨说,没有足够的信息来确定新冠病毒的传播是由于实验室泄漏,还是由于与实验室外的受感染动物接触,从而传到人类身上。

病毒样本的基因序列提供了关于 SARS-CoV-2 如何从另一种动物(很可能是蝙蝠)转移到我们这个物种的关键线索。最宝贵的是大流行早期的序列,因为它们让科学家更接近最初的溢出事件。

布鲁姆在审查各个研究小组公布的基因数据时,看到了 2020 年 3 月的一项研究,其中包含武汉大学科学家收集的 241 个基因序列的信息。电子表格显示,科学家们已经将这些序列上传到一个名为「序列读取档案」(Sequence Read Archive)的在线数据库中,该数据库由美国政府的国家医学图书馆(National Library of Medicine)管理。

但当布鲁姆本月早些时候在数据库中查找武汉的基因序列时,他得到的唯一结果是「项目未找到」。

他很困惑,回到电子表格中寻找更多的线索。它显示,这 241 个序列是由武汉人民医院一位名叫傅爱思(音)的科学家收集的。通过搜索医学文献,布鲁姆最终发现了傅爱思及其同事于 2020 年 3 月在网上发布的另一项研究,该研究描述了一种针对 SARS-CoV-2 的新实验测试。三个月后,中国科学家在一份科学杂志上发表了这篇文章。

在这项研究中,科学家们写道,他们观察了 45 份鼻拭子样本,这些样本取自「疑似 Covid-19 流行初期的门诊患者」。然后他们在棉签中寻找部分 SARS-CoV-2 的遗传物质。研究人员没有公布他们从样本中找到的基因的实际序列,只公布了一些病毒的突变。

但是一些线索向布鲁姆表明,这些样本是 241 个丢失序列的来源。这些论文没有解释为什么这些序列被上传到序列读取档案后又消失了。

通过仔细研究档案,布鲁姆发现很多序列都以文件的形式存储在谷歌云上。他报告说,每个序列都包含在云中的一个文件内,文件的名称都有相同的基本格式。

布鲁姆将武汉的一个遗失序列的编码换了进去。突然,他得到了序列。他总共用这种方法从云中恢复了 13 个序列。

有了这些新数据,布鲁姆再次回顾了大流行的早期阶段。他将这 13 个序列与其他已发表的早期冠状病毒序列结合,希望在构建 SARS-CoV-2 病毒族谱方面取得进展。

弄清 SARS-CoV-2 从蝙蝠病毒演化而来的所有步骤一直是一个挑战,因为科学家需要研究的样本数量仍然有限。一些最早的样本来自 2019 年 12 月暴发疫情的武汉华南海鲜批发市场。

但这些市场上的病毒实际上有三种额外的突变,而这些突变在几周后收集的 SARS-CoV-2 样本中是缺失的。换句话说,这些后来的病毒看起来更像在蝙蝠身上发现的冠状病毒,这支持了这种病毒的一些早期谱系没有经过海鲜市场的观点。

布鲁姆发现,他从云中恢复的被删除序列也没有这些额外的突变。「它们与蝙蝠冠状病毒的相似度比华南海鲜市场的病毒高三倍,」布鲁姆说。

他说,这表明当 SARS-CoV-2 进入市场时,它已经在武汉或其他地方传播了一段时间。他认为,市场的病毒并不代表 2019 年底已经传播开来的冠状病毒的全部多样性。

他说:「也许我们根据测序得出的情况和武汉早期存在的情况可能有些偏差。」

布鲁姆在他的报告中承认,必须通过对病毒序列的更深入分析来证实这一结论。沃罗比说,他和他的同事正在对 SARS-CoV-2 基因进行大规模研究,以更好地了解其起源,他们现在将添加布鲁姆恢复的 13 个病毒序列。

「这些额外的数据将在这项工作中发挥重要作用,」沃罗比说。

目前尚不清楚一开始为什么这些宝贵的信息丢失了。科学家可以通过向序列读取档案的管理员发送电子邮件来请求删除文件。管理该档案的国家医学图书馆表示,这 13 个序列是在去年夏天删除的。

「这些 SARS-CoV-2 序列于 2020 年 3 月提交给 SRA 发表,随后在 2020 年 6 月被提交它的调查人员要求撤回,」美国国立卫生研究院发言人雷纳特・迈尔斯(Renate Myles)说。

她说,调查员——她未透露其姓名——告诉档案管理员,序列正在更新,并将被添加到另一个数据库中。但是布鲁姆已经搜索了他知道的每一个数据库,都没有找到。「显然,我不能排除这些序列在某个其他数据库或网页上的某个地方,但我无法在我该找的地方找到它们,」他说。

得出 13 个序列的该 2020 年实验研究的合著者中,有三人没有立即回复就布鲁姆的发现发出的询问电邮。该研究没有提供另一位合著者傅爱思的联系信息,他的名字也出现在另一项研究的电子表格中。

一些科学家觉得,删除这些序列不见得就等于背后有什么不可告人的事。犹他大学(University of Utah)病毒学家斯蒂芬・戈德斯坦(Stephen Goldstein)说:「我不太明白这怎么就意味着掩盖了。」

戈德斯坦指出,实验研究列出了武汉研究人员在其中发现的个体突变。他说,虽然完整的序列不再在档案中,但关键信息已经公开了一年多。它只是被塞在一种研究人员难以找到的格式中。

「我们都错过了这篇相对不为人知的论文,」戈德斯坦说。

「你真的说不好为什么它们会被删除,」布鲁姆在接受采访时承认。「你可以说移除它们的实际后果是人们没有注意到它们的存在。」他还指出,中国政府下令销毁一些早期病毒样本,并禁止未经批准发表有关冠状病毒的论文。

而对沃罗比来说,他仍然想要答案。「我希望我们听到那些生成但随后删除这些关键序列的作者的意见,以便我们能够更多地了解他们这样做的动机,」他说。「从表面上看,这确实很奇怪,确实需要一个解释。」

不管这 13 个序列下落如何,布鲁姆现在想知道在网上还能发现什么样的线索。为了重建 Covid-19 的起源,所有这些线索可能都很重要。

「理想情况下,我们需要尝试找到尽可能多的其他早期序列,」他说。「而且我认为这项研究表明我们应该所有地方都看看。

我们应该学会去理解别人的观点,不仅仅是服从和被告知。

Project Che

我们应该学会去理解别人的观点,不仅仅是服从和被告知。

我们应该学会去理解别人的观点,不仅仅是服从和被告知。
我们应该学会去理解别人的观点,不仅仅是服从和被告知。
时代的水流漫过了每一只筏子,浸湿了我们的脚,而大雨迟早要来。

开门见山,明知山有虎

所有火中取栗、蹈火赴汤和洞若观火的报道,都是易燃品。

Continue Reading