dijous, 5 de gener del 2023

És la ciència d’ara menys disruptiva que la d’abans?

Bibliometria: Des de fa tres o quatre dècades és fàcil sentir en aspirants a científics el plany de no haver nascut en una època anterior més propícia a pioners. Així, per exemple, en la biologia molecular hom enveja els qui en les dècades centrals del segle XX posaren les bases d’aquesta disciplina. Potser una mica d’aquest sentiment el trobem ja en la famosa expressió d’Isaac Newton segons la qual els homes de la seva generació podien veure lluny perquè eren damunt dels muscles de gegants. És clar que els de generacions posteriors consideren Newton un gegant en ell mateix. I, al capdavall, aquesta expressió contempla els avenços científics i tecnològics com un procés endogen d’acumulació. Michael Park, Erin Heaney i Russell J. Funk presenten en un article a la revista Nature una manera quantitativa de descriure el caràcter disrupció de les publicacions i patents científiques. Això podria ajudar a resoldre el dilema següent: en les darreres dècades s’ha mantingut un creixement exponencial en el volum de publicacions i patents científiques i tecnològiques, però al mateix temps hi ha la percepció d’un alentiment del progrés en moltes àrees de recerca. Park et al. han aplicat el seu índex CD a 45 milions de publicacions científiques i a 3,9 milions de patents de les darreres sis dècades. Aquest índex CD caracteritza les xarxes de citacions entre aquests documents. Troben una tendència en aquest període a la baixa pel que fa al grau de disruptivitat de les publicacions, és a dir de la capacitat de trencar amb el passat i obrir noves direccions. Aquesta tendència és comuna a diferents àrees d’estudi. Aquest declivi, paradoxalment, es vincularia a una forma més restringida d’emprar el coneixement previ. No seria tant un producte d’una caiguda en la qualitat de les publicacions científiques o en la pràctica de citar publicacions anteriors, sinó deriva fonamental de les pròpies ciències i tecnologies.

La tendència a la baixa del caràcter disrupció de ciència i tecnologia publicades s’arrossegaria des de fa un segle, amb una interrupció remarcable entre els anys 1960 i 1980, i es manifestaria fins i tot si l’anàlisi es redueix a les revistes científiques de major impacte.

La disrupció en l’avenç científic i tecnològic

Michael J. Park i Russell J. Funk treballen a la Carlson School of Management de la University of Minnesota, a Minneapolis. Erin Leahy és professora de sociologia a la University of Arizona, amb seu a Tucson. Funk i Leahy contribuïren cooperativament a la concepció i disseny d’aquest estudi. Funk i Park contribuïren a l’adquisició, anàlisi i interpretació de les dades. Funk creà el programari emprat en l’estudi. La recerca tingué el suport de la National Science Foundation. Tots tres autors redactaren l’article, que fou tramès a Nature el 14 de febrer del 2022. Després d’un procés de revisió en el que participaren Diana Hicks i altres, l’article fou acceptat el 8 de novembre, i publicat el 4 de gener del 2023.

Si hom ha remarcat que el segle XX fou una època d’expansió del coneixement científic i tecnològic sense precedents en la història, també s’ha assenyalat que en el segle XXI sembla haver-se perdut aquesta pistonada, i que l’activitat innovadora es desaccelera. En alguns àmbits això ja ha generat preocupació social, com és el cas dels semiconductors o dels fàrmacs. La recerca publicada o que aspira a ésser-ho sembla menys innovadora i més tancada en àmbits d’estudi. Hom ha assenyalat, per exemple, que l’interval entre la concessió del Premi Nobel i l’any de la descoberta ha crescut perquè la ciència que es fa ara és menys meritòria.

Seria temptador atribuir aquesta tendència al fet que de l’arbre de la ciència ja s’han recollit el fruit de les branques més baixes, i que les de més amunt són més difícils de collir. Una altra possibilitat és que, en augmentar la càrrega de coneixements, científics i innovadors necessiten més temps per especialitzar-se en les disciplines respectives de manera que una porció superior de la carrera científica es destina a la formació en detriment de la innovació estricta.

Park et al. han analitzat 25 milions de publicacions científiques del període 1945-2010 accessibles al Web of Science (WoS) i 3,9 milions de patents del període 1976-2010 de la base de dades de la United States Patent and Trademark Office’s (USPTO). Les dades WoS inclouen un total de 390 milions de citacions entre els 25 milions dels títols analitzats, dels quals 13 milions consten de resum o abstract. Les dades de USPTO consten de 35 milions de citacions entre els 3,9 de títols (tots ells amb l’abstract corresponent). Park et al. han replicat les dades en 20 milions de publicacions consultables a JSTOR, al corpus de la American Physical Society, el Microsoft Academic Graph i a PubMed.

L’índex CDs de disruptivitat

Les dades de WoS arrenquen en el 1900, però Park et al. s’han estimat més restringir l’anàlisi al període 1945-2010. És després de la Segona Guerra Mundial l’organització social de la ciència adquireix els seus trets moderns. Alhora no poden avançar més enllà del 2010 ja que les publicacions de la dècada passada encara no han tingut temps suficient per ésser adequadament citades. Entre el 1900 i el 2017, l’arxiu WoS consta de 65 milions de documents publicats en 28.968 revistes, i 735 milions de citacions entre ells. D’aquests 65 milions de documents, 29 milions disposen de resum. El resum o abstract apareix en les bases de dades de WoS a partir del 1913 i progressivament s’ha generalitzat. En reduir la finestra temporal al període 1945-2010 i eliminar-hi les revisions de llibres i comentaris, Park et al. se centren en una mostra analítica de 24.659.076 publicacions.

Pel que fa a les patents, Park et al. seleccionen el període 1976-2010, ja que no s’han digitalitzat els textos anteriors al 1976. En el període 1976-2017 hi ha 6,5 milions de patents concedides, amb 92 milions de citacions entre elles, i totes dotades d’abstract. El 91% són patents d’utilitat. En seleccionar només les patents d’utilitat i el període 1976-2010, Park et al. seleccionen com a mostra analítica un total de 3.912.353 patents.

Park et al. utilitzen un índex CD de disruptivitat. Observen una tendència a la baixa en la mostra analitzada. Per veure si això es manté en tots els àmbits de la ciència utilitzen com a unitat d’observació en les regressions l’autor x any. Aquestes unitats són agregades en les 150 àrees de matèria de WoS i en les 138 subcategories NBER de patents.

L’índex CD5 és recalculat també per a quatre bases de dades addicionals: JSTOR (1.703.353 publicacions del 1930 al 2010), el corpus APS (478.373 publicacions del 1930 al 2010), el Microsoft Academic Graph (1 milió de publicacions seleccionades aleatòriament) i PubMed (16.774.282 publicacions del 1930 al 2010).

Park et al. consideren també alternatives a l’índex CD com ara DI. L’índex CD quantifica el grau amb el qual una publicació cita una publicació focal juntament amb les predecessores d’aquesta darrera. La disrupció consisteix en el fet que la publicació focal sigui citada de forma independent a les seves predecessores.

La mesura de la disrupció

Park et al. difereixen entre dos tipus d’aportacions. El primer tipus es correspon a contribucions que milloren el coneixement consistent i que consoliden l’status quo. El segon tipus es correspon a contribucions que somouen el coneixement existent, fent-lo obsolet i impulsant la ciència i la tecnologia en noves direccions. Aquest segon tipus de contribució serà citat per publicacions ulteriors sovint de manera desconnectada a les contribucions que ella mateixa citava. En el primer tipus de contribució no hi hauria el mateix grau de desconnexió. L’índex CD va de -1 (aportacions consolidadores) a +1 (aportacions disruptives). L’índex CD5 aplica aquest criteri als primers cinc anys posteriors a la publicació analitzada.

Per a les publicacions de ciències socials analitzades, l’índex CD5 passà d’una mitjana de 0,52 el 1945 a 0,04 en el 2010, una caiguda del 91,9%. En el cas de les publicacions de ciències físiques la caiguda és del 100%: del 0,36 del 1945 al 0,00 del 2010. En les patents en informació i comunicacions la caiguda entre el 1980 i el 2010 és del 78,7% (del 0,30 al 0,06). En les patents farmacèutiques i mèdiques la caiguda entre el 1980 i el 2010 és del 91,5% (del 0,38 al 0,03). Val a dir que la taxa de declivi no és uniforme, i que hi ha indicis d’estabilització entre el 2000 i el 2005. Si ens fixem en l’evolució entre el 1980 i el 2010, la caiguda en disruptivitat és molt marcada en ciències socials i en tecnologia, mentre que és més modesta en ciències de la vida i biomedicina i en ciències físiques.

La caiguda en disruptivitat és, de tota forma, força general, cosa que s’adiu poc amb la idea que es deu al fet que en el passat era més fàcil trobar “coses noves”.

L’impacte en el llenguatge científic i tecnològic

La caiguda en la disruptivitat de les noves publicacions es podria manifestar també en l’evolució del llenguatge científic i tecnològic com una reducció en la taxa d’introducció de neologismes. Park et al. constaten que així ha estat. En els títols de les publicacions de ciències socials la introducció de neologismes cau un 76,5% entre el 1945 i el 2010. La caiguda és encara superior en les publicacions tecnològiques (88%). En els títols de patents la caiguda entre el 1980 i el 2010 és del 32,5% per a patents químiques i del 81% per a patents informàtiques i de comunicacions. La caiguda en el ritme d’introducció de neologismes s’acompanya en una reducció en les innovacions fraseològiques. Park et al. constaten com verbs associats a creació (‘produce’, ‘form’, ‘prepare’ i ‘make’), descoberta (‘determine’ i ‘report’) i percepció (‘measure’) cedeixen pas a verbs associats a millora (‘improve’, ‘enhance’ i ‘increase’), aplicació (‘use’ i ‘include’) o valoració (‘associate’, ‘mediate’ i ‘relate’).

El nombre absolut de treballs altament disruptius

Si bé és cert que hi ha una caiguda en el nivell mitjà de disruptivitat de la ciència i tecnologia publicades, Park et al. troben una constància en el nombre absolut de treballs altament disruptius. És clar que això ho podem veure d’una altra manera: per generar els mateixos treballs disruptius que en dècades anteriors ara cal fer un esforç de recerca molt superior al de llavors.

Les causes de la caiguda en la disruptivitat

Park et al. troben que la caiguda en la disruptivitat és quelcom generalitzat a totes les àrees de recerca. Atribuir-ho a una caiguda en la qualitat de la ciència i tecnologia publicades no sembla creïble, si atenem que la caiguda en disruptivitat es manté fins i tot seleccionant únicament les revistes de major impacte (Nature, PNAS o Science).

Tampoc sembla que es pugui atribuir a un canvi en les pràctiques de publicació o citació, ja que la tendència es manté quan es fa un ajustament pel nombre de citacions de cada article.

Park et al. troben una associació positiva entre el creixement del coneixement (mesurat com l’estoc de publicacions i patents) i l’índex CD5 de publicacions. Això concorda amb la idea dels “muscles de gegants”, segons la qual el coneixement previ ajuda a fer contribucions disruptives. En canvi l’associació pel que fa a les patents és negativa, com si les invencions del passat inhibissin innovacions disruptives. Park et al. troben que hi ha una tendència entre científic i inventors a citar una menor diversitat de treball, cosa que atribueixen a una tendència cap a l’especialització. El patró de citacions es concentra a citar les obres prèvies més conegudes, i a recolzar més en l’autocitació. La distància temporal entre una publicació i les publicacions que cita augmenta. Tot plegat assenyala que els investigadors recorren a un coneixement més estret, més familiar i menys actualitzat.

L’especialització científica facilita adquirir un bon nivell de publicacions d’impacte a través d’unes línies de recerca limitades però productives. Això si bé beneficia les carreres individuals dificulta les aproximacions multidisciplinars necessàries per a aportacions més disruptives. Tot i amb tot, Park et al. assenyalen que el nombre absolut d’aportacions disruptives no ha disminuït.

Park et al. consideren que la promoció de ciència i tecnologia disruptives passa per estimular entre els acadèmics hàbits de lectura àmplia i dotar-los de temps suficient per familiaritzar-se amb els nous coneixements científics (vet ací la rellevància dels anys sabàtics). Cal canviar el focus de la quantitat a la qualitat, i desintoxicar-se de la cultura del “publica o pereix”. Caldria que les agències de finançament apostessin més pel suport a llarg termini de carreres científiques individuals i no tant a projectes específics.

Lligams:

- Papers and patents are becoming less disruptive over time. Michael Park, Erin Leahey, Russell J. Funk. Nature 613: 138-144 (2023).