divendres, 24 d’abril del 2020

La transmissió del SARS-CoV-2 a Espanya en el mes de febrer

Epidemiologia genòmica: Amb un total de 22.157 morts (47,4 morts per cada 100.000 habitants), Espanya és un dels països més afectats per la pandèmia de covid-19. Fins i tot ara, “passat el pic”, a Espanya moren centenars de persones d’aquesta malaltia. És comprensible, doncs, que apareguin intents per entendre la dinàmica de transmissió del virus causant, el SARS-CoV-2, a Espanya. L’epidemiologia genòmica del SARS-CoV-2 compta actualment amb 3226 seqüències, gràcies a les quals s’han identificat tres grans clades de distribució mundial, G, V i S. José Alcamí i Inmaculada Casas han coordinat un estudi filodinàmic de la transmissió del SARS-CoV-2 a Espanya i a Europa. Mitjançant anàlisis filogenètics de probabilitat màxima i filodinàmics bayesians han estimat l’origen temporal i geogràfic més probable de diferents clústers filogenètiques i les vies de difusió del virus. Les han aplicades a les primeres 28 seqüències genòmiques completes de SARS-CoV-2 obtingudes de pacients d’Espanya. D’aquestes 28, 13 són del clade G, 13 del clade S i 2 del clade V. Onze genomes del clade S s’agrupen en el clúster monofilètic S-Spain. Sis genomes del clade G s’agrupen en el clúster monofilètic G-Spain. En el clúster S-Spain també es troben 8 seqüències procedents de sis països diferent d’Europa i d’Amèrica. L’ancestre comú més recent del SARS-CoV-2 es trobaria a Wuhan al voltant del 24 de novembre del 2019 (amb un interval del 95% del 30 d’octubre al 17 de desembre). L’origen del clúster S-Spain remuntaria al 14 de febrer del 2020, i el del clúster G-Spain al 18 de febrer. El clúster S-Spain podria tindre un ancestre intermedi en Shanghai. A través d’Espanya, el clúster S-Spain s’hauria difós a altres països. Les dades s’han de prendre en cautela per la petita dimensió de la mostra, però indiquen que a Espanya el virus de l’actual brot epidèmic hauria arribat en un mínim de dues introduccions a mitjan de febrer. Aquesta finestra temporal coincideix amb l’estimada per Coma et al. per a Catalunya a partir dels excessos de casos atribuïts a la grip estacional i que vam comentar la setmana passada.

Una anàlisi filodinàmica

Els estudis filogenètics foren realitzats per Francisco Díez Fuertes, de la Unidad de Inmunopatología del Centro Nacional de Microbiología del Instituto de Salud Carlos III, de Majadahonda, i de l’IDIBAPS de l’Hospital Clínic de Barcelona.

Les seqüències completes foren obtingudes a partir de mostres respiratòries per María Iglesias-Caballero (de la Unidad de Virus Respiratorios y de la Gripe del Centro Nacional de Gripe de l’ISCIII), Pilar Jiménez, Mercedes Jiménez i Ángel Zaballos (de la Unidad de Genómica de l’ISCIII).
En l’anàlisi bioinformàtica de seqüències participaren Sara Monzón, Sarai Varona i Isabel Cuesta (de la Unidad de Bioinformática de l’ISCIII).

Els autors agraeixen el suport tècnic de Mar Molinero, Mónica González-Esguevillas, Sara Camarero i Diana Santos, de la Unidad de Virus Respiratorios de l’ISCIII. També agraeixen la Unidad de Respuesta Rápida del Centro Nacional de Microbiología la participació en el diagnòstic de casos, així com als serveis de microbiologia que aportaren les mostres de pacients: Hospital Universitario Virgen de las Nieves, Hospital General Universitario de Guadalajara, Hospital General de Segovia, Complejo Asistencial Universitario de Burgos, Hospital Santa María Nai, Hospital Universitario La Paz, Hospital Universitario Fundación Jiménez Díaz, Hospital Universitario 12 de Octubre, Hospital Universitario Ramón y Cajal, Hospital Txagorritxu de Vitoria, Hospital Clínic de València i Consorci Hospital General Universitari de València. També tenen paraules d’agraïment als autors i laboratoris que han aportat seqüències a la base de dades de GISAID.

Díez-Fuertes, Javier García Pérez i Mayte Pérez-Olmeda (de la Unidad de Inmunopatología del SIDA de l’ISCIII) redactaren el primer esborrany, al qual contribuïren després Iglesias-Caballero, Cuesta, Zaballos, Michael M. Thomson (de la Unidad de Biología y Variabilidad del VIH de l’ISCIIII), Francisco Pozo (de la Unidad de Virus Respiratorios de l’ISCIII), José Alcamí i Inmaculada Casas.
Els primers símptomes d’un cas que avui es reconeix com a coronavirosi-19 (covid-19) remunta a Wuhan l’1 de desembre del 2019. Vers l’11 de gener hom reconeixia l’agent causant com un nou coronavirus, que fou adscrit a l’espècie SARS-CoV, i designat com a SARS-CoV-2, per bé que alguns altres prefereixen els termes HCoV-19 o nCoV.

D’acord amb la base de dades genòmica de GISAID, hi hauria tres clades principals de SARS-CoV-2 en l’actual fase pandèmica:
- el clade S, caracteritzat per la mutació L84S en ORF8, es troba difós majoritàriament a Amèrica del Nord.
- el clade V, caracteritzat per la mutació G251V en ORF3, s’ha difós majoritàriament per Àsia i Europa.
- el clade G, caracteritzat per la mutació D614G en la proteïna S, es troba difós majoritàriament a Europa.

En els casos de covid-19 a Europa participen sobretot aquests tres clades, però és el clade G el més difós en el nostre subcontinent. La base de dades GISAID recull més de 5.000 seqüències genòmiques completes de SARS-CoV-2 procedents d’Europa.

D’acord amb les dades de l’ECDC, els primers casos a Europa es registraren la setmana del 26 de gener, amb 5 casos a França (4 d’importats i 1 contagi local), 4 casos a Alemanya (tots contagis locals), 2 casos importats a Itàlia, 2 casos importats al Regne Unit i 1 cas importat a Finlàndia.
A Espanya els primers casos registrats es corresponen a la setmana següent, la del 2 de febrer, amb un primer cas a La Gomera (importat des del clúster detectat la setmana anterior a Alemanya) i un segon cas a Mallorca (procedent d’un ciutadà britànic que s’hauria contagiat a Singapur, i que hauria estat també relacionat amb un clúster de casos a França).

Hem d’esperar, però, a la darrera de setmana de febrer per veure més casos confirmats a Espanya. Cal recordar que en aquell moment només es feien proves diagnòstiques a persones que presentessin símptomes i tinguessin un historial de viatge a les zones amb transmissió comunitària reconeguda del virus. Fou així que el 25 de febrer es reportaren cinc casos, tots ells amb un historial de viatge a Itàlia: un a Tenerife, dos a Barcelona, un a Castelló i un a Madrid. El 26 de febrer, es reportaren 18 casos més, a Canàries, Catalunya, Andalusia i València. La setmana de l’1 de març els casos confirmats de covid-19 ja eren a Espanya un total de 261, i entre ells ja apareixien casos greus sense historial de viatge (un altre supòsit per accedir a una prova de PCR).

Díez-Fuertes extragueren de la base de dades de GISAID totes les seqüències de genoma complet (> 29.000 parells de nucleòtids) del SARS-CoV-2, que en aquell moment eren 1590. Després feren una extracció exclusiva de les seqüències genòmiques completes d’Europa i de la ciutat de Wuhan, per tal d’estudiar la dinàmica de transmissió vírica des de Wuhan al nostre subcontinent. En aquest darrer conjunt hi ha les seqüències corresponents a Espanya i als primers països europeus amb casos positius (França, Alemanya, Itàlia i Finlàndia). Les seqüències eren alineades amb un programari MAFFT, i editades amb AliView v.1.26.

Amb el programari FastTree v2.1.11 s’inferien les filogènies dels alineaments llargs. Amb TempEst v1.5.1 es mesuraven les distàncies d’arrel a la punta de l’arbre filogenètic d’acord amb les dades de recol·lecció de les mostres. Amb BEAST v.1.10.4 es feien anàlisis filogenètiques bayesianes amb escala de temps per tal d’estimar la data i localitat dels ancestres comuns més recents de cada branca i, alhora, la taxa d’evolució del virus. Amb BEAUTI v1.10.4 s’introduïen aspectes com un model de rellotge molecular relaxat no-correlacionat i un model coalescent de creixement exponencial.
Les seqüències duplicades que apareixien en les bases de dades eren descartades. La credibilitat dels arbres filogenètics eren comprovades amb cadenes markovianes de Monte Carlo.

Amb SpreaD3 eren analitzades històries evolutives de trets discrets associats amb les filogènies.

Una filogènia del SARS-CoV-2 d’Espanya a partir de 28 seqüències genòmiques completes

En la base de dades analitzada hi havia un total de 28 seqüències genòmiques completes procedents de mostres clínics d’hospitals espanyols. D’aquestes 28, 14 procedien de Madrid (12 seqüenciades als hospitals universitaris de Octubre, de La Paz i de Ramón y Cajal), 5 procedien del País Valèncià (seqüenciats per la fundació FISABIO), 4 de Castella i Lleó, 2 de Castella-la Manxa, 1 d’Andalusia, 1 de Galícia i 1 del País Basc.

D’aquestes 28 seqüències, 13 pertanyien al clade G, 2 al clade V i 13 al clade S.

De la base de dades de seqüències europees es comprovava que la seqüència EPI-ISL-406862 era basal per al clade G i per a un mínim de 6 seqüències d’Espanya que es podien definir un clúster monofilètic (“G-Spain”). La seqüència EPI-ISL-406862 procedia d’una mostra recollida d’un pacient de Munic el 28 de gener del 2020.

Pel que fa al clade V, les seqüències espanyoles s’integraven en un clúster que tenien com a basals dues seqüències, una de Suècia (recollida el 7 de febrer del 2020) i una altra de França (recollida el 23 de gener del 2020). D’aquestes 13 seqüències espanyoles.

Pel que fa a les 13 seqüències espanyoles del clade S, n’hi havia 11 que servien per definir un clúster monofilètic (S-Spain). En la base d’aquest clúster hi havia una seqüència procedent d’una mostra de Shanghai recollida l’1 de febrer del 2020.

L’ancestre comú més recent de la base de dades conjunta d’Europa i de Wuhan es pot datar a Wuhan el 24 de novembre del 2019 (amb un interval de confiança del 95% que va del 30 d’octubre al 17 de desembre). De Wuhan hauria difós a Anglaterra, Alemanya, França, Espanya, Finlàndia i Itàlia. D’acord amb aquesta base de dades, la taxa d’evolució del SARS-CoV-2 seria de 1,47·10-3 substitucions per lloc i per any (amb un interval de confiança del 95% entre 1,08 i 1,87·10-3).

L’origen més probable del clúster S-Spain es trobaria a Shanghai pels vols del 28 de gener del 2020 (amb un interval de confiança del 95% entre el 21 de gener i el 2 de febrer). L’ancestre comú més recent de S-Spain es localitzaria a Espanya pels volts del 14 de febrer (amb un interval de confiança del 95% entre el dia 4 i el 23). En el clúster S-Spain també queden incloses 8 seqüències de 6 altres països (Estats Units, Països Baixos, Xile, Brasil, Geòrgia i França). L’arribada d’aquest clúster a Europa procedent d’Àsia s’hauria fet a través dels Països Baixos. Val a dir, que amb una anàlisi restringida a les seqüències europees l’ancestre comú més recent de S-Spain es trobaria a Anglaterra, amb una data del 18 de gener del 2020 (amb un interval de confiança del 9-27 de gener).

L’origen del clade V és més difícil d’escatir. L’ancestre comú més recent dataria del 23 de desembre del 2019 (amb un interval de confiança del 95% entre el 26 de novembre i l’11 de gener). En el clade V distingir un subclúster primerenc (consistent bàsicament en casos transmesos a Àsia i Austràlia) i un subclúster més recent (dominant per seqüències europees). La seqüència EPI-ISL-418243 de Madrid i la seqüència EPI-ISL-417975 d’Andalusia pertanyen a un subclúster de V que tindria un ancestre comú més recent a Anglaterra amb data del 5 de febrer del 2020 (amb un interval de confiança del 95% entre l’1 i el 9 de febrer). La seqüència EPI-ISL-417952 de Madrid pertany a un subclúster amb un ancestre comú més recent més incert, datat del 10 de febrer (amb un interval de confiança de l’1-20 de febrer). L’arribada del clade V a Europa s’hauria fet a través de dues introduccions, una d’Anglaterra (difosa després als Països Baixos, Itàlia i Escòcia) i una altra de Noruega (difosa després a Anglaterra, Suècia, Finlàndia, Luxemburg i Bèlgica).

L’ancestre comú més recent del clade G a Europa es localitza a Anglaterra amb data del 20 de gener del 2020 (amb un interval de confiança del 95% entre el 10 i el 29 de gener). En la base d’aquest clade trobem la seqüència bavaresa EPI-ISL-406862. El clade inclou vora el 50% de tots els genomes seqüenciats de la base de dades. L’arribada del clade G a Espanya s’hauria fet per diverses vies. El subclúster G-Spain, doncs, només abasta una part de les seqüències del clade G a Espanya (en aquest estudi hi entren EPI-ISL-418251, EPI-ISL-417963, EPI-ISL-417954, EPI-ISL-417978, EPI-ISL-417956 i EPI-ISL-417967). El subclúster G-Spain té el seu ancestre comú més recent localitzat a Espanya amb data del 18 de febrer del 2020 (amb un interval de confiança del 95% entre el 9 i el 25 de febrer).

El problema de la reconstrucció de la transmissió del virus en el temps i en l’espai

D’acord amb l’anàlisi filodinàmica l’ancestre comú més recent del SARS-CoV-2 es trobaria en un interval entre el 30 d’octubre i el 17 de desembre del 2019. Aquest interval coincideix amb l’aparició dels símptomes del pacient més antic conegut del brot de Wuhan, que es produí l’1 de desembre del 2019.

La taxa evolutiva del SARS-CoV-2, segons aquests estudis, seria de 1,08-1,87·10-3
substitucions per lloc i any, un valor comparable al que s’ha trobat en els altres coronavirus humans epidèmics, el SARS-CoV-1 i el MERS-CoV.

El trànsit aeri hauria jugar un paper cabdal en l’expansió global del virus. Wuhan és la principal ciutat de la Xina Central i, a data de gener del 2020, tenia vols directes amb París (6 vols setmanals), Londres (3 vols setmanals), Roma (3 vols setmanals) i altres ciutats europees. De fet, entre els primers representants europeus del clade V del SARS-CoV-2 hi ha mostres recollides a França entre el 23 i el 28 de gener a una parella de turistes (pare i filla) procedent de Wuhan. Ara com ara, Díez-Fuertes et al. reconeixen que no poden assegurar si el clade V arribà a Espanya a través d’algun país europeu.

L’arribada del clade G del SARS-CoV-2 a Europa fou més indirecta. S’associa amb un brot de 12 casos confirmats de Baviera que esclatà entre el 19 i el 22 de gener del 2020. Els casos haurien estat transmesos per un home de negocis alemany “asimptomàtic” que hauria tingut contacte amb un resident de Shanghai, el qual resident donà efectivament positiu per al SARS-CoV-2 el 26 de gener. Les dates coincideixen amb l’anàlisi filodinàmica, que situa l’ancestre comú d’aquest clade en el 19 de gener. Ara bé, l’anàlisi filodinàmica es fa sobre un nombre limitat de genomes, on hi ha sobrerepresentada Anglaterra (58 genomes) i subrepresentada Alemanya (8 genomes).

Díez Fuertes et al. identifiquen en aquest estudi el clúster G-Espanya, a partir de 6 seqüències de Madrid, i que dataria del 18 de febrer del 2020.

Pel que fa al clade S d’Espanya hauria tingut origen a Shanghai el 28 de gener, però no queda clar si va arribar-hi de manera directa o a través d’un altre país europeu. Les dades epidemiològics indicarien que el clade S arribà a Europa a través d’un vol procedent de Shanghai en un home de negocis resident a França que retornava d’un viatge professional en el decurs del qual havia visitat Wuhan. El clade S-Spain s’hauria originat vers el 14 de febrer, i seria a la base de casos de covid-19 exportats des d’Espanya als Estats Units, Països Baixos, Xile, Brasil, Geòrgia i França.

Un clúster que també ocupà titulars en el seu moment és el produït a l’estació alpina de Contamine-Monjoie, que afectà 13 persones entre el 6 i el 15 de febrer, entre elles els qui foren els primers casos confirmats al Regne Unit, França i Espanya. Una d’aquestes seqüències, EPI-ISL-410486, és inclosa a la base de dades però no pertany a cap dels clades majoritaris (G, V o S). Cap de les seqüències espanyoles analitzades per Díez-Fuertes et al. es relaciona amb aquest clúster, però cal recordar que només es consideren en aquest estudi 38 seqüències.

Lligams:

- Phylodynamics of SARS-CoV-2 transmission in Spain. Francisco Díez Fuertes, María Iglesias Caballero, Sara Monzón, Pilar Jiménez, Sarai Varona, Isabel Cuesta, Ángel Zaballos, Michael M. Thomson, Mercedes Jiménez, Javier García Pérez, Francisco Pozo, Mayte Pérez Olmeda, José Alcamí, Inmaculada Casas. doi: https://doi.org/10.1101/2020.04.20.050039 (2020)