怎么点评剑桥大学研讨称新冠病毒分三个变种最陈旧型更多发现于美国和澳洲

放大字体  缩小字体 2020-04-11 16:16:49  阅读:3411 作者:责任编辑NO。杜一帆0322

剑桥大学4月9日宣布关于新冠病毒的几个变种和传达途径的研讨报告指出,新冠病毒分为A、B、C三个变种,而不少人据此推出了一系列阴谋论。我觉得有点过早了。

由于,这个定论,上个月中科院西双版纳热带植物园就宣布过相似的了。

写在篇前的话

1、数量不代表来历

有个很大的歧义点是,一些人一看到A型更陈旧,且美国更多,就直接像打鸡血相同了。其实,数量多,更多的是传达问题。你们还记得把病毒分为S和L型的NSR文章吗?S型陈旧,L型年青,成果在武汉L型占了96%多,而其原因首要在于L型更具有侵略性。

而作者关于哪型在哪个区域更多这样的一个问题也指出,这是进化挑选的成果,不相同合适不同的宿主。(These genomes are closely related and under evolutionary selection in their human hosts, sometimes with parallel evolution events, that is, the same virus mutation emerges in two different human hosts)

2、这篇文章最大的亮点是算法上,用了人类学里的算法去测验研讨病毒。

究竟论文的首要贡献者便是那个仅有不是foster的人,现在爱好之一是人类学。经过新的算法发现了病毒的平行进化现象(parallel evolution),也便是病毒的不相同合适不同的人群,A类型合适北美,B类型合适东亚。当然,之所以呈现这样的一种情况,是由于病毒的奠基者效应(所谓奠基者便是子孙集体的姿态很大程度取决于先人)。

3、病毒多样化和病毒源头是两码事。

许多时分咱们简略发生一种观点,便是你看xx当地的多样性更高,那么它就更可能是来历地。包含之前的那个广为流传的某视频。其实,这个是不对的,简略直白地类比, 美国的族群规划杂乱程度很高,可是你必定不认为美国是人类来历吧?

相同,数量最多也不能代表源头。

4、文章运用的参阅基因组依然是最早发布的武汉测序的那一个。

这一点却是业界通用的,究竟第一条上传的序列,往往会被当作参阅序列,剩余的序列会和它比。(The sequence range under consideration is 56 to 29,797, with nucleotide position (np) numbering according to the Wuhan 1 reference sequence)

这儿其实有个小小的问题,那便是,咱们事实上默认了后边的一切病毒都是由这个变异来的,可是有的时分,换个参阅或许就不相同,不过这样的一个问题有一个最大的妨碍便是蝙蝠的序列。所以,假如可以找到更陈旧的病毒序列,乃至直接找到可以把现在的病毒都作为姊妹群的病毒,那么或许整个情况都要被改写,究竟根序列变了,那许多东西都要变。

5、仍是一个样本规划问题。

其实这样的一个问题讨论过许多了,便是,现在简直一切的剖析,满是依赖于最开端的那一波数据,可是咱们都知道,那一波数据是有源头性问题的,由于咱们直接默认了华南海鲜商场,而后来证明,华南海鲜商场并非最早来历,顶多是个爆发点。

事实上,理论上,假如咱们对武汉当地的病毒进行更多的全基因组测序,或许能发现更多有意思的东西,不过咱们早就停下来了,究竟这东西做了对立疫也没啥用,还花钱贻人口实,那不是自讨苦吃吗哈哈。

6、研讨文章中有不少内容可能会让读者看了想说“你行你上”。

首要我是不太认可“你行你上”这种理论,不然论坛有啥存在含义呢?直接崇拜威望算了;其次PNAS这个期刊一向有个备受诟病的问题便是,假如它本身是美国科学院院刊,你只需是院士,哪怕你在上面夸师母,相同可以宣布(有没想到冰川冻土哈哈?),这便是院士特权,特征之一便是写的contribute。

包含当年Venter写的用基因算长相被science拒掉的时分,他也动用了这个权利把文章丢到了PNAS上,然后那个science评委(当然也是大牛Yaniv Erlich)还很愤恨地和Venter两人大战300回合(当然成果便是每人都发了一堆文章~究竟大牛打架都是要用论文的哈哈哈)。

事实上,关于这篇文章,砖头早就飞了。比方Andrew Rambaut,进化范畴的超级巨佬就指出文章有严重错误。

微博上一些相关范畴人士的点评

@polyhedron,复旦的严实博士,做分子人类学的。

@fengfeixue0219,中科院的郗旺 ,也便是飞雪之灵,做植物分子遗传的。

以下为正文部分

首要,当我看到这篇论文的时分,第一时刻就意识到,这又充值了。

由于其时一看作者,4个作者,3个foster,这便是一家子发论文,就有一种不祥的预见,这可能是“水文”。

并且还真的不是我随意说的,1和4是亲兄弟哦,听说2是1的老婆~真是foster承包了。

好吧,仅有破例的是第三个,可是更是让我惊呆了,由于这个人是整个论文的首要推动者。

一看到contributed,我瞬间就理解了,这群院士又开端“水”了,这个院士是做啥的呢?答案是考古学。

研讨欧洲史前内容,比方希腊基克拉迪群岛的史前前史、基克拉迪文明与东南欧和西南欧的联系、埃及和美索不达米亚的前期文明传达等等,当然后期对分子人类学感爱好。

特别阐明:我对colin Renfrew是没有定见的,人家是考古学的尖端专家,可以当院士,必定是实力出众。

PNAS是美国科学院院刊,它的文章有两种,一种是细心submit的文章,一种便是contribute,后者的文章,便是哪怕你去写一篇夸师娘,只需你是院士,也可以宣布出来。所以PNAS影响因子不高,备受诟病,很大一部分是由于这些院士去contribute了,院士们有优先宣布且不受限制的权利。

特别阐明:并非一切的contribute都是“水文”,可是在PNAS里,contribute“水文”份额确实很高。

好吧, 不管怎么说,尽管心里预期自己又要看一篇渣文了,可是仍是咬着牙看下去,万一有惊喜呢。

成果从头看到尾,最终证明,我仍是想多了,真的没惊喜。

全文中心便是这张图(是的,其他图是附件的图)。

给我们瞅一眼全文,3页

便是我们了解的进化树,长的表明进化距离远,短的表明进化距离近。

细心一看,这图早就看了许屡次了,就比方我们了解的这张图。

本质上都相同。

很陈旧的祖先bat,然后便是武汉的病毒,接着持续分为ABC,A是从武汉回去的美国人,B是武汉型,C是欧洲型。

这东西老早就知道了,为啥他们仍是重复一遍呢?

我就去看了下数据来历:we here present a phylogenetic network of 160 largely complete SARS-Cov-2 genomes。

160?怪哉,都是来自GISAID database,确实少了,咋仍是160个数据呢?为啥不多点?

注:文章写的时分是“March 4,2020”,投稿时刻是“March 17, 2020”,发出来是昨日,可是这样一个时刻段其实gisaid数据现已不少了。作者也说了,3月4号的时分都现已有“254 coronavirus genomes”了。

不过reviewer真的是太好了,我最近就碰到了一个认(bian)真(tai)的审稿人,让我用他的主张从头计算了一次三代基因组,然后一个小修折腾了3个月了(中心不断让变化十几次了)。

我还专门登入gisaid去看了,你瞅瞅人家的数据,这么多点点呢。

或许看看这图:

Full genome treesof S clade

或许这种:

Full genome treesof G clade

已然要发文章,能真的加点数据吗?尤其是送审都3月17了,发出来是4月份,中心的新数据哗啦啦的,弥补点数据很有必要的。

当然,文章中仍是有些内容的。

比方南美洲的巴西病毒是归于C的,从意大利传过去的(废话,人家新闻报道的便是去意大利游览了)。

比方加拿大的安大略那一例,是有武汉/广东游览史,分类也天然归于这一支了。

墨西哥却是破例,他的病毒是B宗族的,并且和意大利/德国比较近。

这个人去过意大利,其实也阐明晰,意大利这当地,早便是各种感染稠浊了。

这张图却是阐明晰一点,便是基因组信息和采样信息很对应,阐明这些日子,这些病毒仍是比较单纯,输入了,我们就检测到了,所以时刻和基因组信息对得上。

到此为止,全文完毕。

基本上便是老瓶子老酒,要不是院士contribute,这文章很难发到PNAS。

当然,文章最大的新意是:运用了character-based phylogenetic networks,这是分子人类学里常用的方法,搁到病毒里去用了。

———后续———

一篇文章水不水,其实读者是可以感受到的,比方这篇文章确实是有点水了,那我们一定会问,那你举个不水的,其实就有啊,比方NSR那篇把病毒分为L型和S型的,显着质量要高出一大截。

当然,我仍是要说:水文,那也是有价值的!

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!