https://bodybydarwin.com
Slider Image

El nou ajudant digital de Samsung, Bixby, intenta impulsar el reconeixement de la veu cap a una veritable IA

2021

L'ús de comandes de veu amb un telèfon intel·ligent no és gens nou, però el nou ajudant digital de Samsung, Bixby, va més enllà del reconeixement de veu, per incorporar l'aprenentatge profund i la cerca visual ampliada per fer-lo sentir més com un assistent digital real que viu al vostre dispositiu.

Bixby fa comparacions immediates amb Apple Siri i Google Assistant, però tot i que sovint pensem en simples veus, Samsung descriu que Bixby té la seva pròpia interfície visual basada en targetes per transmetre informació. La veu és només una part de l’equació. Els altres aspectes són la visió (com utilitzar la càmera per escanejar un codi QR, esbrinar el cost d’un llibre basat en la seva portada o traduir text), recordatoris i recomanacions. Bixby és el terme paraigua d'aquestes quatre funcions intel·ligents.

Sriram Thodla, director general de Samsung centrat en la intel·ligència i la Internet de les coses, va presentar Bixby al públic durant l’acte d’anuncis Galaxy S8 i S8 + dimecres. "Bixby entén el context que va dir. "Sap el que està passant a la pantalla."

Per exemple, podeu demanar-li que faci una captura de pantalla del que esteu fent i, a continuació, enviï aquesta imatge a un contacte. Aquest tipus de sol·licitud complexa que abasta diverses aplicacions i serveis ha estat problemàtica per als assistents digitals en el passat.

"Diem que Bixby és una interfície d'usuari intel·ligent", va dir Mok Oh, vicepresident per a l'estratègia de serveis de Samsung, en una entrevista en un esdeveniment de premsa dilluns.

Oh, va oferir una extensió completa de Bixby, el que significa que si una aplicació està habilitada Bixby, qualsevol cosa que puguis fer amb el toc també es pot fer mitjançant veu. Per exemple, podríeu demanar a Bixby que canviés l’idioma de visualització del telèfon a un altre idioma i Bixby ho hauria de fer. L’assistent també està perdonant inconscientment, Oh, va dir, per la qual cosa hauria de fer front a l’ambigüitat en les sol·licituds.

Ah, es va posar de relleu l'aplicació fotogràfica del telèfon, anomenada Galeria i les milers de diferents combinacions de tasques que un usuari podria fer dins d'aquesta. Hi ha infinites maneres en què un usuari pot ordenar que una imatge sigui retallada o editada i Bixby hauria de ser capaç de gestionar-ho.

En moltes maneres, apliquem tecnologia de l'aprenentatge profund, a Bixby, va dir Oh. Un aspecte d’això és que Bixby proporcionarà als usuaris una opció de disminució de polze o de polze després d’haver gestionat una sol·licitud, per tal que Bixby sàpiga com ho va fer i l’ajudés a aprendre. Actualment, apliquem l'aprenentatge en molts, molts aspectes diferents de tota la nostra pila tecnològica per a això, va afegir.

Això és fonamental per a agents virtuals com Bixby, va dir Alex Rudnicky, un professor d'investigació en informàtica de la Carnegie Mellon University que es centra en la parla. Necessiteu algun tipus de reforç que bàsicament permeti que el sistema aprengui bàsicament comprendre la connexió entre el que vol l’usuari i el que passa realment, va dir . Realísticament, l’agent va cometre molts errors.

L’aplicació Alexa d’Amazon té una funció similar, preguntant a l’usuari si feia el que volia.

A més de les seves habilitats escoltadores, Bixby també pot veure al món real. Mitjançant la càmera integrada del S8, Bixby pot detectar objectes en una escena i cercar informació sobre aquest producte i sobre productes relacionats. Per descomptat, també et permetrà comprar-los als socis de Samsung. Aquesta és una característica que actualment Siri no ofereix, i Google Assistant, sovint amb resultats mixtos, però aquest tipus d’interacció a la realitat augmentada és un pas lògic per a AI com a assistent personal.

Per a la cerca visual, Samsung ha tocat diverses empreses associades com Amazon per fer compres, Foursquare per a funcions específiques de localització (Thodla va utilitzar un exemple en què va fer una foto de l’icònic edifici Flatiron de Nova York i va obtenir informació al respecte, així com bones opcions gastronòmiques a la zona) i Google Translate per interpretar signes en diferents idiomes.

Finalment, Bixby també hauria de recollir els patrons de situació, va dir Oh; si acostuma a fer una trucada telefònica quan tornes a casa de la feina, l’assistent pot recollir-lo i, a continuació, et recomana que ho facis. Thodla també va tocar aquest punt durant la presentació del dispositiu, dient que Bixby podria suggerir un Uber si s’adona que se’n fa habitualment un a un cert moment.

Bixby té una pantalla d'inici pròpia que contempla la informació que ha après sobre l'ús típic. La informació de diverses aplicacions es mostra a les targetes, i les que es mostren més rellevants es posen a la part superior. Així, al matí es prioritzen coses com el temps i el correu electrònic, mentre que a la nit pot impulsar les xarxes socials cap amunt. Tot això, però, és variable, ja que Bixby obté comentaris de l'usuari.

En general, el reconeixement de patrons i la consciència situacional, en què un assistent virtual fa suggeriments, separa les habilitats de reconeixement de veu i connectivitat simples de la intel·ligència artificial, segons Kris Bondi, el màxim responsable de màrqueting de Neura. Neura realitza un motor AI que se centra en la personalització i la identificació del context i dels moments de la vida dels usuaris.

La Llei del Federalisme de Drone canviaria la regulació als governs estatals i locals

La Llei del Federalisme de Drone canviaria la regulació als governs estatals i locals

Les aus borratxes estan causant estralls a Minnesota

Les aus borratxes estan causant estralls a Minnesota

Revisió del cercle de Logitech: aquesta càmera de seguretat intel·ligent pot funcionar sense fils

Revisió del cercle de Logitech: aquesta càmera de seguretat intel·ligent pot funcionar sense fils