dissabte, 10 de maig del 2025

Difface: el genoma com a mirall del rostre

Genètica humana: En el 1900 el programa de la genètica era investigar l’heretabilitat de trets biològics. La genètica molecular de la segona meitat del segle XX va permetre entendre la base bioquímica d’aquesta heretabilitat. Tant es van perfeccionar les tècniques de seqüenciació genètica que s’obrí la porta de la ‘genètica inversa’, és a dir a reconstruir fenotips a partir de la informació genotípica. Això és el que vol fer Difface, una eina que permet la reconstrucció tridimensional d’un rostre humà a partir de dades de seqüència d’ADN. Fan Liu, Chunman Zuo, Sijia Wang i Luonan Cheng són els autors corresponsals d’un article a Advanced Science, que té com a primer autor Mingqi Jiao, on expliquen com s’ho fan. Jiao et al. entenen la morfologia facial com un marcador biomètric, sense ignorar el seu ús en la determinació de la identitat personal, tant en la vida quotidiana com en la ciència forense. La seqüenciació d’alt rendiment fa possible l’obtenció barata i ràpida d’informació genètica. Si les tècniques prèvies de seqüenciació genètica ja permetien la identificació unívoca d’una persona a partir de mostres biològiques desconegudes, què no serà possible ara. Difface s’inspira en les tècniques d’intel·ligència artificial de síntesi d’imatges a partir de text. Ho fa a través d’un model de multi-modalitat que sintetitza imatges facials tridimensionals exclusivament a partir de seqüències d’ADN. Utilitza un transformador i una xarxa de convolució espiral per cartografiar la relació entre polimorfismes mononucleotídics (SNPs) i trets facials. Jiao et al. l’han provada en una base de dades amb 9674 fenotips de xinesos Han de SNP i d’imatges facials tridimensionals. El model té la capacitat de predir l’evolució dels trets facials d’una persona a diferents edats.

Difface és capaç d’oferir una reconstrucció de novo del rostre d’una persona a partir d’informació de seqüència genètica. El punt de partida és una base de dades de polimorfismes mononucleotídics (SNP).

La genètica de la morfologia facial

La morfologia facial és un tret biomètric únic i característic de la persona. Té un component d’herència genètica.

El perfil d’ADN és una estratègia fonamental en la medicina forense, que permet identificar individus a partir de mostres biològiques.

El fenotipatge d’ADN parteix d’una seqüència genètica per deduir trets fenotípics, com ara el color dels cabells o dels ulls.

El rostre humà és integrat fonamentalment per ulls, nas, barbeta i boca. La seva morfologia respon a factors genètics i ambientals.

Jiao et al. contrasten la variabilitat facial de la població de la Xina amb la de la població dels Estats Units. La població de la Xina és de majoria Han, amb una homogeneïtat genètica que es manifesta en una menor variabilitat de la forma i pigmentació del rostre. En canvi, la població dels Estats Units és la d’un melting pot d’onades migratòries.

Tant en un context com en l’altre no és tampoc tasca senzilla la de deduir característiques facials a partir de dades genètiques. D’entrada, el coneixement sobre la genètica facial és limitat. D’altra banda, en la identificació facial participa tota una sèrie de trets biomètrics.

A la Xina s’han fet avenços per entendre la base genètica de la morfologia facial. Els estudis genòmics d’associació cerquen la identificació de loci genètics concrets que siguin rellevants per a la població Han.

En un sentit invers, però complementari, hom treballa en aprenentatge mecànic per aconseguir la identificació automàtic a partir d’un rostre humà de característiques com el sexe, l’edat, l’ascendència, l’orientació sexual, etc.

Jiao et al. expliquen que Difface s’ha mostrat efectiva sobre una base de dades de 9674 individus Han xinesos. La precisió de la reconstrucció augmenta quan hom complementa la informació genètica amb dades fenotípiques com ara l’edat, el gènere, l’índex de massa corporal, etc. El model ha ajudat a establir relacions entre trets de SNPs i regions facials.

Jiao et al. són conscients que aquesta tecnologia comporta reptes quant a la privacitat genòmica, amb implicacions ètiques i legals.

El funcionament de Difface

Difface és un model de multi-modalitat dissenyat per a reconstruir imatges facials tridimensionals a partir de fenotips de SNP. Empra un transformador i una xarxa de convolució espiral per cartografiar SNPs fins a transformar-los en núvols de punts tridimensionals.

En el procés d’entrenament, Jiao et al. empraren aprenentatge contrastiu per tal de construir l’associació entre imatges genètiques i imatges facials.

En el procés de construcció, Difface empra una xarxa de difusió per generar imatges facials humanes tridimensionals a partir de trets genètics de cada individu.

L’alineament de l’ADN amb imatges facials tridimensionals

L’avaluació es va fer amb escàners superficials de rostre de 9674 persones de tres cohorts independents de la Xina. D’aquestes persones hom disposava de dades genètiques de SNPs. S’identificaren així 7842 variants genòmiques associades significativament (P = 5 × 10−8) amb imatges facials tridimensionals. Aquestes variants eren considerades SNPs d’entrada, i constitueixen el vector SNP d’entrada de Difface.

Jiao et al. han comparat Difface amb els mètodes de Mahdi i de Sero. Els supera en termes d’identificació i de verificació.

Difface permet la generació d’imatges d’ADN i facials tridimensionals

Jiao et al. han calculat la distància entre els núvols de punts facials reals i els generats per Difface. L’error mitjà és de 3,52 mm.

L’addició a Difface d’informació sobre el sexe de l’individu redueix l’error mitjà a 3,06 mm. En afegir-hi, a més l’edat i l’índex de massa corporal, l’error mitjà es redueix a 2,93 mm. En canvi, si hom retira llavors la informació sobre SNPs, l’error mitjà puja a 7,03 mm.

En passar de la joventut a l’edat mitjana, el canvi de magnitud és de 1,430. En passar de l’edat mitjana a la vellesa el canvi és de 1,689. El canvi de la joventut a la vellesa és globalment de 2,415. Això es trasllada en una caiguda amb l’edat dels trets facials.

La reconstrucció individual d’imatges facials

Difface pot reconstruir individualment imatges facials amb el procés de difusió.

La morfologia nasal és particularment heretable. Per això, Jiao et al. estratifiquen els trets facials en dues categories principals, la nasal i la d’altres zones de la cara.

Jiao et al. conduïren un test cec amb 10 voluntaris. Cada participant havia d’identificar el rostre real corresponent a un rostre generat sintèticament dins d’una sèrie de rostres reals. Les sèries eren de 5, 10 i 20 cares. Si amb 5 cares, la taxa d’identificació correcta era del 75,6%, amb 20 cares això queia a 51,1%.

Jiao et al. empren un procés de punt determinantal (DPP) per quantificar la diversitat en els trets facials generats per Difface. Troben que es troba dins del marge de diversitat dels rostres reals.

La definició d’un conjunt de SNPs rellevants

En medicina forense no sempre és fàcil aconseguir un nombre elevat de SNPs a partir de mostres d’ADN. Jiao et al. posen a prova Difface reduint la base de dades de SNPs entre el 10% i el 90%.

Altres estudis han indicat que hi ha 107 variants genètiques associades amb la morfologia nasal. La morfologia nasal distintiva de les poblacions de l’Àsia Oriental, relativament plana i àmplia, respondria a adaptacions locals a factors ambientals i a la deriva genètica.

Quan Difface no pot accedir a més del 70% dels SNPs comença a errar la forma del nas, tant pel que fa al perfil com a la forma de la punta del nas.

Si al 100% de SNPs, Difface comet un error mitjà de 3,517 mm, quan ha de treballar sobre el 10% l’error puja a 3,957 mm. Els errors augmenten especialment en els punts de nàsion, subnasal i queilió. El perfil del nas, la forma de la punta nasal i l’aparença de les galtes decauen si disminueix el nombre de SNPs.

Enfortiment del model amb SHAP i GWAS

SHAP (SHapley Additive exPlanations) és un mètode basat en la teoria de joc cooperatiu. Pot assignar valors quantitatius a trets SNP individuals.

GWAS (Genome-Wide Association Studies) permet centrar-se en SNPs amb valors SHAP elevats. Així hom pot identificar SNPs vinculats a la direcció de la base nasal o a l’altura de l’arrel nasal.

D’acord amb l’anàlisi GO (Gene Ontology), els SNPs més rellevants són implicats en processos biològics com ara la ‘regulació de la transició d’epiteli a mesènquima’ i la ‘morfogènesi d’epiteli embriònic’. Són processos que influeixen en el desenvolupament ossi i muscular, en la vascularització i en la simetria. Vies com el ‘desenvolupament del sistema esquelètic’ o el ‘desenvolupament d’òrgan muscular’ són cabdals en la morfologia facial.

Línies de recerca futures

Jiao et al. creuen que cal la incorporació a Difface de variables com l’edat i l’índex de massa corporal. Això farà que Difface pugui simular de manera efectiva els canvis facials associats a l’edat, i també la capacitat de generar reconstruccions facials en un rang de tipus corporals possibles.

Difface s’ha desenvolupat en el context de cohorts xineses, però podria aplicar-se a altres contextos demogràfics.

Una eina com Difface comporta reptes ètics i legals. Podria aplicar-se a la reidentificació de dades genòmiques anonimitzades.

Lligams:

- De Novo Reconstruction of 3D Human Facial Images from DNA Sequence. Mingqi Jiao, Jiarui Li, Bingxu Zhong, Siyuan Du, Shuning Li, Manfei Zhang, Qibin Zhang, Zhongming Liang, Fan Liu, Chunman Zuo, Sijia Wang, Luonan Chen . Advanced Science (2025).