https://bodybydarwin.com
Slider Image

Facebook va utilitzar milers de milions d’instagrames d’Instagram per entrenar la seva IA

2021

Penseu en els hashtags d’Instagram. Quan algú carregui una fotografia a la plataforma propietat de Facebook, pot afegir un hashtag. Podria ser una cosa així com #love, #fashion o # photooftheday; aquests van ser els tres principals hashtags de l’any passat. Mentre que aquestes etiquetes il·lustren conceptes abstractes, hi ha un munt de descriptors més concrets, com #brownbear, que, sorprenentment, està ple d’imatges de la ursina.

Però, mentre que els hashtags són una bona manera perquè algú pugui veure milions de #travel fotos en un mateix lloc, Facebook va utilitzar aquelles fotografies etiquetades per fer una altra cosa: formar el seu programari de reconeixement d’imatges, que és una mena d’intel·ligència artificial anomenada visió per ordinador en la qual ensenyeu a un ordinador a reconèixer el que hi ha en una imatge.

De fet, han utilitzat uns 3.500 milions d’instagram d’instagram (de comptes públics) i 17.000 hashtags per formar un sistema de visió informàtica que diuen que és el millor que han creat encara.

El conseller delegat de Facebook, Mike Schroepfer, ha anunciat avui la investigació en la conferència de desenvolupadors de la companyia, F8, anomenant els resultats "estat de la tecnologia".

Per entendre per què es tracta d’un enfocament interessant, ajuda a conèixer la diferència entre l’entrenament “totalment supervisat” i el “feble supervisat” per als sistemes d’intel·ligència artificial. Cal ensenyar sistemes de visió informàtica per reconèixer objectes. Mostra'ls imatges que porten l'etiqueta "ós", per exemple, i poden aprendre a identificar les imatges que creu que són els óssos de les fotos noves. Quan els investigadors utilitzen fotografies que els humans han anotat perquè un sistema de IA pugui aprendre d’elles, això s’anomena “totalment supervisat”. Les imatges estan clarament etiquetades perquè el programari pugui aprendre d’elles.

"Funciona molt bé", afirma Manohar Paluri, responsable de la visió per ordinador del grup d'aprenentatge de màquines aplicades de Facebook, que va realitzar la investigació juntament amb una altra divisió de la xarxa social anomenada Facebook AI Research. L'únic problema amb aquest enfocament és que les imatges han de ser etiquetades en primer lloc, cosa que requereix treball dels humans.

"Passar a milers de milions [d'imatges etiquetades] comença a ser inviable", afegeix Paluri. I en el món de la intel·ligència artificial, quantes més dades pugui obtenir un sistema, en general és millor. I també és important dades diverses Si voleu ensenyar a un sistema de IA per reconèixer com es veu un casament, no voleu només mostrar-lo fotografies de casaments d’Amèrica del Nord, sinó de bodes a tot el món. .

Introduïu l'aprenentatge "feblement supervisat", en què les dades no han estat etiquetades amb cura per les persones amb l'objectiu d'ensenyar una IA. És aquí on van entrar en joc tots aquests milers de milions de fotos d’Instagram. Aquests hashtags es converteixen en una manera de representar el treball amb etiquetes. Per exemple, l’etiqueta #brownbear, combinada amb l’etiqueta similar #ursusarctos, es converteix en l’etiqueta d’imatges d’ós. Els usuaris d’Instagram es van convertir en els etiquetadors.

Però aquest tipus de dades són desordenades i imperfectes i, per tant, sorolloses. Per exemple, Paluri assenyala que algú que faci una foto d’Instagram a prop de la Torre Eiffel encara pot donar-li aquesta etiqueta, però la torre en si no és visible. Aquesta etiqueta encara té sentit en el context humà, però no serveix per a un ordinador amb mentalitat simple. En un altre escenari, és possible que una escena de festes d'aniversari que tingui un pastís no es pugui etiquetar #cake, cosa que tampoc serveix de res si intenteu formar un ordinador com és aquest postre.

Però el resultat final és que malgrat el soroll de les dades originals, Paluri diu que, en última instància, va funcionar molt bé. Mesurat per un punt de referència, el sistema –entrenat en aquests milers de milions d’informàtics– era de mitjana un 85% exacte. Paluri diu que és el sistema de visió informàtica més fort que encara ha fet Facebook.

Si utilitzeu Facebook, ja sabeu que pot reconèixer les cares de les fotos que pengeu i us suggereixen etiquetar-les amb el nom adequat. Aquest és un exemple de visió per ordinador: en aquest cas, el reconeixement facial. Però, sota el capó, Facebook utilitza la visió per ordinador per identificar altres coses a més de cares, com ara contingut visual (com ara pornografia) que no està permès a la plataforma.

Paluri diu que ja s'està utilitzant la nova tecnologia amb formació d'Instagram per ajudar-los a marcar contingut objectionat en fotografies que no haurien de ser al lloc. A l'hora de reconèixer "contingut objectable", diu, ja han notat una "millora significativa de la precisió".

L'exoesquelet d'aquesta aranya sembla un casc per a un alienígena molt petit

L'exoesquelet d'aquesta aranya sembla un casc per a un alienígena molt petit

El mode de fotografia Night Sight de Google és excel·lent: es tracta de com falsificar amb el telèfon intel·ligent

El mode de fotografia Night Sight de Google és excel·lent: es tracta de com falsificar amb el telèfon intel·ligent

Sí, els humans estem provocant un canvi climàtic.  I ens coneixem des de fa 40 anys.

Sí, els humans estem provocant un canvi climàtic. I ens coneixem des de fa 40 anys.