dimecres, 17 de desembre del 2025

La predicció de resistència a antimicrobians en mostres bacterianes

Microbiologia: La resistència als agents antimicrobians (AMR) constitueix una amenaça de salut en forma d’infeccions intractables. En general, aquesta resistència és mitjançada per gens, de manera que la seqüenciació genòmica es pot fer servir en la detecció. Les dades de vigilància genòmica de patògens bacterians generen una quantitat ingent de dades de manera que hom confia en aplicacions d’aprenentatge mecànic (ML) per predir i identificar els determinants de la resistència. Yanying Lu, Nicole E. Wheeler i Lars Barquist, però, hi veuen un problema en aquesta aproximació. Malgrat el que ens pugui semblar, les poblacions bacterianes tenen una estructuració elevada, de manera que qualsevol programa de vigilància hauria de fer un esforç per seleccionar-hi mostres representatives. Ara bé, els mostreigs microbiològics tenen un biaix lògic a favor de mostres clíniques, de manera que la vigilància genòmica es fa preferencialment sobre isolats relacionats amb malalties humanes. La ML requereix una independència entre les mostres que aquest biaix fa impossible. En un article a PLos Biology Yu, Wheeler i Barquist posen de relleu l’efecte de confusió derivat de l’estructura mostral que es produeix en una anàlisi de 24.000 seqüències genòmiques completes de cinc tipus de patògens bacterians amb diferents fenotips AMR. La ML en aquest cas confon resistència i filogènia, la qual cosa n’afecta els models predictius resultants. Per a resoldre-ho no n’hi ha prou amb un augment de la mida mostral d’entrenament. Yu et al. analitzen 6740 models per entendre l'efecte derivat d’espècie i de fàrmac antimicrobià. Això mostra la importància d’una perspectiva d’una sola salut en la vigilància genòmica de microorganismes patògens per tal de bastir mètodes representatius de l’estructura poblacional de tots els contextos ecològics on es troben aquests microorganismes.

Electromicrografia de bacils d’Escherichia coli obtinguda per Peter Highton en el 1968

L’aprenentatge mecànic en el seguiment de la resistència a agents antimicrobians

Aquest article ha tingut com a editor acadèmic Tobias Bollenbach (Universitat zu Koln). L’article fou tramès a PLoS Biology el 7 de febrer, i després d’un procés de revisió fou acceptat el 13 de novembre, i publicat el 16 de desembre.

Aquesta recerca ha rebut finançament del Ministeri bavarès de Ciència i Arts i un ajut del NSERC canadenc.

La resistència a fàrmacs antimicrobians (AMR) és al darrera cada any de 4,95 milions de morts, i la perspectiva és que aquesta xifra augmenti. Si l’amenaça creix, es pot arribar a posar en entredit la indicació de teràpies mèdiques avançades que impliquen cirurgia i/o immunosupressió, ja que el risc associat a patògens resistents pot sobrepassar els beneficis d’aquestes teràpies.

Les tècniques microbiològiques clàssiques, com els antibiogrames, han estat complementades en les darreres dècades amb tècniques de seqüenciació que investiguen els gens responsables de les resistències. Aquestes tècniques permeten fer una monitorització de l’aparició i difusió d’AMR. Ara bé, les tècniques de seqüenciació generen un volum tan ingent de dades que calen sistemes automatitzats que transformin les seqüències nucleotídiques en prediccions de perfils de resistències i en identificacions de nous mecanismes de resistència.

L’aprenentatge mecànic (ML), en el marc de l’anomenada intel·ligència artificial, pot fer front a aquestes tasques? Els mètodes clàssics de ML assumeixen que les dades d’entrenament són de distribució independent i idèntica. Ara bé, les mostres de vigilància de patògens rarament poden reflectir l’estructura subjacent de les poblacions bacterianes. En un context epidèmic, els clons bacterians més aptes es difonen més ràpidament. Entre els factors d’aquesta aptitud hi poden haver determinants d’AMR, de forma que pot emergir una associació entre fenotip i marcadors filogenètics no directament involucrats en l’AMR. A més, les mostres analitzades en aquestes campanyes de vigilància presenten tota una sèrie de biaixos: mostres clíniques en detriment de mostres ambientals; mostres de pacients greus en detriment de mostres de la població general; mostres de països rics en detriment de mostres de països subdesenvolupats; etc.

La biologia comparativa i evolutiva ha tractat la qüestió de la dependència filogenètica de gens i trets des de fa més de mig segle. Hom ha desenvolupat eines estatístiques per corregir-ne els efectes. Per exemple, en estudis d’associació genòmica (GWAS) en microorganismes es poden aplicar models d’efecte mixt de correcció de biaixos mostrals.

L’impacte del biaix mostral en la predicció per aprenentatge mecànic de resistències a antimicrobians

Yu et al. han aplegat entre 3204 i 7188 genomes de cadascuna de tres espècies de bacteris gram-negatius i dues espècies de bacteris gram-positius, representatives dels patògens prioritaris de l’OMS:
- Escherichia coli, responsable d’infeccions dels tractes gastrointestinal i urinari.
- Klebsiella pneumoniae, responsable d’infeccions oportunistes.
- Salmonella enterica, responsable d’infeccions gastrointestinals.
- Staphylococcus aureus, membre de la microbiota cutània i responsable d’infeccions oportunistes.
- Streptococcus pneumoniae, principal responsable de la pneumònia nosocomial.

Aquesta base de dades inclou fenotips de resistència per a 27 antibiòtics.

Yu et al. exclouen les combinacions antibiòtic-microorganisme amb menys de 1000 genomes. També són excloses les soques resistents o susceptibles que abasten més del 80% de les dades. Així tenen un nombre mitjà de genomes de 2700, amb un 44% de soques resistents.

Per a cada espècie construeixen un alineament genòmic amb posicions Roary. Amb SNP (polimorfismes mononucleotídics) identifiquen les posicions variables en l’alineament.

Com model representatiu ML, Yu et al. seleccionaren LightGBM, que consisteix en un mètode d’arbre de decisió estimulat per gradient.

Amb IQ-Tree identifiquen clades discrets per a cadascuna de les cinc espècies bacterianes. Coincideixen amb els tipus de seqüència establerts en la literatura. Amb l’estructura de clade poden simular biaixos en els casos d’entrenament patològic, en quatre escenaris:
- escenari a: exclusió d’isolats resistents en les dades d’entrenament del clade de prova.
- escenari b: exclusió d’isolats susceptibles.
- escenari c: exclusió de soques susceptibles d’un altre clade.
- escenari d: exclusió de soques resistents d’un altre clade.

L’exclusió de soques resistents, com era previsible, condueix a una manca de precisió, i a una insuficiència en detecció d’AMR. L’exclusió de soques susceptibles condueix al biaix contrari. Yu et al. consideren que els models de ML prenen marcadors de llinatge com a indicadors d’AMR.

L’ampliació de les dades d’entrenament a tots els clades no resol el biaix d’excloure de la mostra isolats resistents o susceptibles, però sí que l’atenua.

La predictivitat de la resistència antimicrobiana varia segons l’antibiòtic i l’espècie.

Quan l’entrenament es fa amb dades d’espècies gramnegatives, la capacitat de predicció dels models és inferior que quan es fa amb espècies grampositives. Yu et al. ho atribueixen a la membrana exterior de les cèl·lules bacterianes gramnegatives.

De manera semblant, la predicció de resistències a la fluoroquinolona varia segons l’espècie.

En el cas de la resistència a la ciprofloxacina, la capacitat de predicció és influïda per la diversitat de gens que hi ha al darrere. El gen parC és responsable de la resistència a la ciprofloxacina de la majoria de clades resistents d’E. coli i S. aureus. El gen gyrA només apareix com a responsable de la resistència a la ciprofloxacina en un sol clade de S. aureus. En altres clades de E. coli i S. entèrica la resistència a la ciprofloxacina és mitjançada pel gen kdgR (un regulador transcripcional), mobB (gen de mobilització), qorA (quinona-oxidoreductasa) o gens codificadors de proteïnes hipotètiques sense funció definida.

Una de les dificultats per a ML és que l’AMR és mitjançada per un gran nombre de variants gèniques, de manera que són rars els predictors forts. En aquest context és fàcil prendre com a indicadors genuïns d’AMR marcadors associats a llinatges que no hi tenen res a veure.

Hem de llençar la tovallola?

Un sistema ML d’AMR té dues aplicacions potencials:
- predicció de resistència d’una soca que ha estat detectada.
- identificació de variants genètiques que causen resistència.

Quan totes les soques d’un mateix llinatge microbià comparteixen resistència a un antibiòtic, la confusió de marcadors de llinatge amb resistència per part d’un ML pot no afectar la seva capacitat de predicció en un context de vigilància microbiana. Ara bé, aquest no sempre és el cas, i quan ho és, la confusió dificulta la identificació de la base molecular de la resistència.

Algoritmes de ML amb capacitat de percebre les relacions de llinatge tindrien una major capacitat per tractar amb l’estructura jeràrquica de les poblacions bacterianes. També hi pot ajudar la incorporació de senyals evolutives com la conservació filogenètica de seqüències. Yu et al. pensen de tota manera que un sistema de vigilància ha d’incorporar mostres clíniques i ambientals representatives. Això passa per incorporar-hi els països de renda mitjana i baixa. També cal que els sistemes de vigilància tinguin una continuïtat en el temps, més enllà dels moments de brots epidèmics.

Lligams:

- Biased sampling driven by bacterial population structure confounds machine learning prediction of antimicrobial resistance. Yanying Yu, Nicole E. Wheeler, Lars Barquist. PLOS Biology (2025).

- BarquistLab/AMR_prediction, on podem consultar el codi utilitzat.

dimarts, 16 de desembre del 2025

Les acceleracions no-gravitacionals del cometa interestel·lar 3I/ATLAS

Astrometria: El passat 29 d’octubre el cometa interestel·lar 3I/ATLAS va fer el pas pel periheli, quedant a una distància de 1,4 UA del Sol. Aquesta setmana 3I/ATLAS farà la màxima aproximació a la Terra, a una distància de 1,8 UA. L’objecte ha pogut ésser estudiat des de la Terra i des de diferents cosmonaus. T. Marshall Eubanks et al. publiquen un article a Research Notes of the ASS en el que ens venen a dir que la trajectòria d’aquest cometa entra dins del rang típic. Ho fan a partir de sis observacions de dues cosmonaus interplanetàries. Recordem que 3I/ATLAS, com el seu nom indica, és el tercer objecte interestel·lar conegut. Com passa amb qualsevol objecte astronòmic en la seva trajectòria hi participen les interaccions gravitatòries i fenòmens no-gravitatoris. L’ús d’observacions terrestres des de maig a desembre serien prou suficients per donar-nos una idea de les primeres, però per descriure l’acceleració no-gravitacional amb prou precisió resulten fonamentals les observacions realitzades per cosmonaus allunyades de la Terra. Eubanks et al. redueixen d’aquesta manera els errors formals d’aquests paràmetres en un 20-40%. L’acceleració no-gravitacional juga un paper significatiu en la trajectòria de 3I/ATLAS, amb una magnitud vectorial a 1 UA de 89,3±4.6·10-9 UA·dia-2 i una diferència temporal (ΔT) de -34,60±2,62 dies. Aquesta acceleració no-gravitatòria fa un pic un mes abans del periheli. Eubanks et al. estimen així que la massa de 3I/ATLAS és de 44 milions de tones a principi d’agost del 2025, la qual cosa equivaldria a un radi de nucli dominat per neu carbònica (CO2) de 374 m.

J. Miller & M. Rodriguez (International Gemini Observatory/NSF NOIRLab), T.A. Rector (University of Alaska Anchorage/NSF NOIRLab), M. Zamani (NSF NOIRLab) van aconseguir aquesta imatge de 3I/ATLAS el 26 de novembre amb el telescopi Gemini North, de Hawaii

3I/ATLAS, un objecte interestel·lar

La determinació de l’òrbita d’objectes interestel·lars (ISO) ens informa del seu origen, de la seva cinemàtica i de les seves propietats nuclears. L’acceleració n’és el paràmetre clau. En l’actualitat la determinació de l’òrbita d’ISOs no depèn exclusivament d’observacions preses a la superfície de la Terra o en l’òrbita baixa terrestre, sinó que també hem de recórrer a les sondes interplanetàries que segueixen òrbites heliocèntriques.

L’acceleració no-gravitacional

Els cometes es defineixen per una activitat consistent en l’emissió de gasos (CO, CO2, H2O) per sublimació que, juntament, amb partícules de pols, integren la coma o cabellera, i la cua, i poden acabar formant eixams de meteors. Aquest procés de pèrdua de material del nucli cometari pot provocar acceleracions de la trajectòria que no obeeixen a les interaccions gravitatòries. L’acceleració no-gravitatòria d’un cometa es pot modelar amb paràmetres constants i un terme escalant g(r) que depèn de la distància heliocèntrica r(t), assumint que g(1 UA) = 1. Els paràmetres que cal resoldre són Ai, on i = 1, 2, 3 fan referència a les acceleracions radial, transversal i perpendicular respecte del pla orbital.

La coma de 3I/ATLAS es troba dominada pel diòxid de carboni (CO2), i cal pensar que aquest és el material predominant del nucli. Això fa pensar que g(r) seria propera a l’invers del quadrat de la distància heliocèntrica (1/r2). El valor de ΔT dependria de g(r(t)), de manera que g’(r(t)) = g(r(t+ΔT). El pic d’emissions de gasos tindria lloc al voltant del periheli, abans o després segons quin sigui el signe de ΔT.

En el cas de 1I/’Oumuamua, hom disposa de 111 observacions preses entre el 18 d’octubre del 2017 i el 2 de gener del 2018. El cas de 2I/Borisov hom disposa de 2117 observacions preses entre el 17 de març del 2019 i el 28 d’abril del 2020.

Per a 3I/ATLAS hom disposa de 4836 observacions entre el 8 de maig del 2025 i l’1 de desembre. Eubanks et al. empren 4194 observacions per fer les seves estimacions. El conjunt E d’observacions inclou totes les dades òptiques preses per observatoris terrestres així com astrometries dels satèl·lits TESS i HST (Telescopi Hubble). El conjunt P afegeix a E dos observacions per la sonda Psyche, realitzades el 8 de setembre i el 29 d’octubre. El conjunt TGO afegeix a E quatre observacions del Trace Gas Orbiter fetes el 3 d’octubre.

L’estimació de la massa de 3I/ATLAS

Com que hi ha acceleració no-gravitacional significativa, Eubanks et al. s’animen a fer una estimació de la massa de 3I/ATLAS a partir de la fórmula:
Ma = (dM/dt)·v.
a és la magnitud de l’acceleració no-gravitacional. dM/dt és la taxa total de pèrdua de massa degut a l’emissió de gasos. v és la velocitat d’aquests gasos.

La velocitat v dels gasos emesos depèn de la massa molecular d’aquests gasos:
v=ζ(8kT/πm)1/2.
on k és la constant de Boltzmann, T és la temperatura, m és la massa molecular (7,38·10-26 en el cas del CO2) i ζ és una constant 0,5-0,6.
de forma que v seria aproximadament de 155 m·s-1.

Les observacions del JWST de principi d’agost oferien un valor de dM/dt de 150 kg·s-1 quan el cometa es trobava a 3,3 UA del Sol. A 1,8 UA, el 24 de setembre, el valor d’a era de 8,9·10-9 UA·dia-2.

Així la massa de 3I/ATLAS seria de 4,4·1010 kg (44 milions de tones mètriques). Si assumim que el nucli cometari té una densitat entre 200 i 600 kg·m-3, el radi seria entre 260 i 374 metres.

La natura de 3I/ATLAS

El radi del nucli cometari 3I/ATLAS es trobaria entre 260 i 374 metres. L’estimació del nucli cometari 2I/Borisov era entre 200 i 500 metres.

L’astrometria indica que 3I/ATLAS pateix una acceleració no-gravitacional en els tres components (radial, transversal i perpendicular). Hi ha un desplaçament significatiu en el pic d’acceleració respecte del periheli. Eubanks et al. confien que l’addició de cinc conjunts de dades d’altres sondes interplanetàries afinarà una mica més l’estimació de massa i de radi.

Lligams:

- Astrometry with Interplanetary Spacecraft: Determination of the Non-gravitational Accelerations of the Interstellar Object 3I/ATLAS. T. Marshall Eubanks, Adam Hibberd, Bruce G. Bills, W. Paul Blase, Andreas M. Hein, Robert G. Kennedy III, Adrien Coffinet, Pierre Kervella. Research Notes of the AAS 9: 329 (2025).