https://bodybydarwin.com
Slider Image

Aquest home vol estalviar la investigació científica per si mateix

2022

DARPA, l'Agència de Projectes de Recerca Avançada en Defensa del govern federal, ha de posar en pràctica què és la CIA per espiar els buffs: una organització atractiva, mitologitzada i ocasionalment críptica. Llegint això, utilitzeu almenys un projecte per sortir de l’agència (internet) i, estadísticament, en teniu un altre a distància: GPS i Siri també es basaven en projectes DARPA. Si voleu fer una ullada als futurs cinc anys, hi ha llocs pitjors per començar. Així, doncs, aquest estiu, quan jo i un grup d’altres periodistes vam ser convidats al Pentàgon a una fira científica DARPA, no va ser sorprenent, doncs molts de nosaltres vam agafar l’agència a l’oferta.

Vés al taulell de facturació del Pentàgon, fes-te el permís de conduir, punxa el teu número de seguretat social a una màquina, camina pels passadissos amb un guàrdia que et demana d’on prové la samarreta i l’has feta al pati. Quan vaig visitar, va ser una calorosa tarda de maig, sovint ennuvolada, amenaçant de ploure el pícnic que el DARPA havia creat amb cura.

La "fira científica" va resultar ser una descripció més exacta del que pensava. Hi havia desenes de taules, organitzades per categoria: big data, ciberwar, fins i tot una tenda lateral que mostrava un projecte de realitat virtual. Hi havia un programari que podia fer un seguiment dels terroristes, un drone que no es pot sentir. I hi havia un home calbós, amb barba i un personatge atrevit al mig, al costat d’un simple rètol que deia Big Mecanisme. Tot i la visualització que es va autoexhaureixer, semblava estar sempre parlant amb algú. Vaig fer unes voltes per les casetes abans de presentar-me.

El seu nom era Paul Cohen, un professor de ciències de la informació de la Universitat d'Arizona, prestat a DARPA, encarregat d'executar un ambiciós projecte: utilitzar dades per canviar fonamentalment la manera de fer de la ciència, creant un programa que llegirà i emmagatzemarà tots els articles escrits sobre un tema. a continuació, trossegeu aquestes dades per trobar solucions a problemes noves, possiblement brillants. És una tasca que cap humà o organització no pot realitzar a soles i el programa pilot se centrarà en el tractament del càncer.

Va seguir explicant. Absorbeix les preguntes de forma reflexiva, es pren el seu temps per respondre. El més emocionat que el vaig veure va ser quan va passar un altre periodista amb una pregunta: Però les màquines no poden tenir pensaments originals, oi?

Cohen s’il·luminava més ràpid que el personal uniformat en un trencall de fum que hi havia al darrere. Pensaments originals? L’ordinador que va batre Kasparov als escacs tenia un pensament original?

"Apostes que tingués un pensament original!"

***

Hi pot haver fins a 1, 8 milions de publicacions científiques publicades a l'any, però el seu abast, tot i que es debaten sobre estadístiques exactes, és sens dubte desagradable: un estudi va determinar que més de la meitat dels treballs no els llegeix mai ningú fora d'autors i crítics. En molts sentits, la ciència encara s’assembla a les edats del Middles: petits enclavaments d’investigadors, passant-se miopament els seus papers sense connectar-los a una visió magnífica.

Ara tenim internet. Disposem de centres de recerca, empreses privades, universitats. El problema no és l'escala, sinó el volum. Els experts llegeixen molts treballs claus per comprendre els seus camps i les institucions llegeixen moltes més, però cap persona o organització pot llegir-les totes, i hi ha una relació entre elles. Mai veurem el bosc amb tants arbres en el camí.

L'informàtic Paul Newell va plantejar el problema així, gairebé a la recerca d'un cercador, en comentaris sobre articles en un simposi de 1973. L'assaig es diu "No es poden jugar 20 preguntes amb la natura i guanya i Cohen és un fan:

Mai en la literatura experimental semblem reunir els resultats de tots els experiments. El document de Posner en el present simposi és un excel·lent exemple: excel·lent tant per mostrar els hàbils intents que fem actualment com per demostrar fins a quin punt queda aquesta integració real dels resultats. Ho fem - Posner - relaciona conjunts d'experiments. Però l’enllaç és extraordinàriament fluix. Es tria i es tria entre els resums qualitatius d’un experiment determinat què cal aportar i juxtaposar amb les preocupacions d’un tractament actual.

El director de l’Oficina d’Innovació d’Informació de DARPA, on està ubicada Cohen, va pronunciar una conferència als periodistes després de les festes de demostració. Un home encantador, sense entusiasme, va saltar a una diapositiva de PowerPoint que mostrava la massiva instal·lació d’emmagatzematge Hangar 51 dels Raiders of the Lost Ark plena de caixes d’enviament, comparant-la amb la informació que passem constantment. Imagineu-vos si hi havia la següent gran cura per a una malaltia.

"Allà és allà, va dir ell. Va a buscar-ho, Indiana Jones."

Cohen vol agrupar aquesta aclaparadora quantitat de recerca en un tot. Això no és tan difícil com sembla. És excepcionalment més difícil del que sona.

Un programari que pot entendre veritablement el llenguatge encara està en la seva infància. Quan es llegeix un article (un document científic o, per exemple, un article com el que esteu llegint ara), el programari agafa alguns indicis. Recollint aquí la importància d’una paraula, una frase que hi ha, pot tenir algun sentit coherent fora del llenguatge, com a mínim suficient per suggerir un article o article relacionat. Però aquesta comprensió és fugaç. Com qualsevol persona que ha intentat utilitzar Google translate us pot dir, les màquines encara tenen problemes per prendre decisions amb el context. És possible que siguin capaços de traduir amb precisió una frase o frase, però es disparen en fer els salts intuïtius necessaris d'un paràgraf o d'un text més llarg.

Cohen pensa, o almenys espera, que pot superar aquests obstacles. Començarà petit: cent papers més o menys sobre el càncer. Si tot va segons el pla, la màquina, coneguda com a Big Mechanism, les llegirà i començarà a desenvolupar la comprensió de la malaltia. Aleshores, Cohen la deixarà solta, i li permetrà raspar les bases de dades de recerca del món per obtenir més informació i milers de documents. Amb el temps, establirà una Gran Teoria Unificada del càncer, una comprensió de com les cèl·lules muten i es converteixen en càncer, com fan estralls al cos, així com quines drogues frenen la propagació. En un treball es descriuen els inicis de la malaltia, un altre el tractament; El gran mecanisme els posaria tots en harmonia.

El resultat final seria una constel·lació de papers, tots connectats i cadascun aportant la seva pròpia contribució a la imatge més gran. Els investigadors, armats amb això, podrien començar a afegir retocs al model, experimentant per veure què podria passar quan s’afegeix un nou fàrmac a l’equació. Encara millor, un gran mecanisme pot ser un dia capaç de crear possibles tractaments per si mateix. La nostra relació amb la investigació, les màquines i la ciència podria canviar.

L’únic xoc inevitable del pla són les persones.

***

La seu de DARPA és una llosa gegant de vidre a Arlington, davant d'un centre comercial. És imponent, però no marcat a part del número de carrer 675 situat a sobre de l'entrada. L’endemà de les demostracions, em vaig trobar amb Cohen. La seguretat a l’edifici era estretament; Vaig passar un detector de metalls, vaig revisar el telèfon i em vaig dirigir a les oficines.

El sòl on treballa Cohen és un pla d’oficines industrials estàndard, més departament universitari que laboratori de científics bojos. Vam anar cap a una sala de conferències marcada per sort sense classificar i vam continuar cap a on vam marxar. Cohen es va asseure amb les cames creuades a la cadira davant de mi.

"Quan escolteu una frase em va explicar que heu de fer una mica de treball mental".

Hi ha innombrables supòsits i interpretacions necessàries per donar sentit al llenguatge. Hi ha fragments de gramàtica i trossos sense sentit sense un context complet.

Fins i tot en el món aparentment sec de la investigació sanitària, hi ha exemples ben documentats del que Cohen anomena “crims menors”: la temptació d’enterrar el fet que un estudi només es va realitzar sobre cucs o que una correlació no pot ser tan decisiva com la la prosa et faria pensar. El gran mecanisme ha de tenir en compte aquests problemes. "Els científics no estan per sobre dels trucs retòrics que va dir.

Per descomptat, hi haurà una quantitat prevista de soroll. La investigació pot resultar que no es pot produir. un defecte en les dades pot provocar una retracció. Però el gran volum de dades del Big Mechanism forçaria el senyal a través del soroll. Cada document, segons Cohen, es basarà en diversos treballs, és a dir, es recolza en més d'un estudi perdut. Una vegada que la màquina tingui aquestes bases, comença el treball sobre l’absorció de la informació nova del model: el programari prendrà les troballes d’un document i trobarà com s’ajusten al gran esquema de recerca. Amb aquest model, podríem trobar que la investigació prèviament incompatible podria coincidir de sobte. Diguem que les conclusions del Paper X semblen contradir les troballes del Paper Y. Un model de màquina podria resoldre les dues en trobar una tercera variable que expliqui les variacions de les ponències. Després d’això, només queda fer un petit salt per desenvolupar nous tractaments contra el càncer o per dur a terme un experiment encara més complicat.

***

Per molt improbable que sembli, el càncer és un sistema relativament fàcil d’entendre, almenys per al projecte Big Mechanism. La malaltia creix i es propaga a nivell molecular i es pot entendre mitjançant una lent estreta: una mica de química, una altra de biologia. Però si el Big Mechanism triomfa, el projecte podria passar a sistemes més complicats, en els quals realment no tenim ni idea de com els canvis afectaran a tot un sistema. Cohen esmenta el clima: "Sabeu com funciona el clima?"

Hm. No?

"Esteu en bona companyia."

Es presenta l’espectre de la geoenginyeria, la controvertida idea que es pot frenar el canvi climàtic mitjançant la manipulació del medi ambient. Què passaria si abocéssim 100 tones de ferro a l’oceà per estimular el creixement del plàncton, tal i com va fer un geoenginyer malaurat? Els resultats podrien ser catastròfics o no. Les relacions del sistema –entre la terra, l’oceà, les plantes i els animals, els innombrables processos químics– són massa complicades per preveure totes les conseqüències d’una mesura dràstica. Però un gran mecanisme pot ser un dia. Això és el que va inspirar DARPA, una sucursal del Departament de Defensa, en el projecte. Una altra organització estructural complicada podria ser la jerarquia d’un grup terrorista; El gran mecanisme podria entendre immediatament on s’assenten els actors principals en una organització criminal, després continuar incorporant nova informació sobre ells en un model d’actualització constant.

Bona part d’això és especulatiu. El projecte encara està en les primeres etapes, i en quina mesura funciona (si funciona en absolut) és algú de les idees. El gran mecanisme pot resultar ser una idea teòricament fascinant que, en última instància, es troba sota aplicacions pràctiques. Vaig assenyalar a Cohen que sembla que estem uns anys lluny de les màquines que analitzen _Moby Dick _ per a la metàfora. Va dir que estaria d’acord, tot i que és optimista sobre les prediccions del que faran les màquines.

De qualsevol manera, aquestes idees teòriques? Realment són alguna cosa.

Si el projecte no funciona, si no només demostra que val la pena sinó que "té èxit espectacular, Cohen diu que serà el cas de crear un nou tipus de llenguatge de recerca, on s'excisin les ambigüitats del llenguatge. Es podria situar un bloc de codi normalitzat a la part superior de tots els treballs en publicar-los, detallant les troballes i la seva rellevància. Un programa classificaria la informació a la teoria adequada a l'instant: cap llenguatge humà per preocupar-se. Els científics no haurien de tornar a preocupar-se dels estudis fins que no trobessin els bits pertinents. ; haurien estat disponibles tan aviat com s'hagin introduït les troballes. Per descomptat, tot això sí que necessita lluitar contra la inèrcia humana, que és una altra batalla completament.

Newell, en aquests comentaris de fa més de 40 anys, va plantejar la seva ambivalència cap a aquest problema:

Que el mateix subjecte humà pugui adoptar molts mètodes (radicalment diferents) per a la mateixa tasca bàsica, segons l'objectiu, el coneixement de fons i els detalls menors de l'estructura de la recompensa i la textura de la tasca, tot això, implica que el mitjà "normal" de la ciència. potser no és suficient. Pel que fa a la primera pregunta, la duresa, reafirmo el meu punt inicial: aquesta és la meva confusa i angoixada mitja paraula. La meva altra meitat té pessigolles de color rosa amb la rapidesa i la distància que hem arribat en l'última dècada, per no parlar dels dos últims dies.

Els llamps, la tempesta de neu: els crits del temporal

Els llamps, la tempesta de neu: els crits del temporal

Gel de mar, abans que sigui massa tard

Gel de mar, abans que sigui massa tard

Per descomptat, les pistoles semiautomàtiques són més antigues.  Aquí és per què els científics van trigar tant a dir-ho.

Per descomptat, les pistoles semiautomàtiques són més antigues. Aquí és per què els científics van trigar tant a dir-ho.