Amazon graver i ambient og generaliserbar intelligens på re:MARS

[ad_1]

Vi er glade for å bringe Remodel 2022 tilbake personlig 19. juli og nesten 20. – 28. juli. Bli med AI- og dataledere for innsiktsfulle samtaler og spennende nettverksmuligheter. Registrer deg i dag!


Veien til “generaliserbar intelligens” – det vil si det mange anser som sci-fi – begynner med omgivelsesintelligens. Og den fremtiden utfolder seg nå.

“Vi lever i det gylne området av AI, hvor drømmer og science fiction blir til virkelighet,” sa Rohit Prasad, senior visepresident og hovedforsker for Alexa hos Amazon.

Prasad snakket om utviklingen fra omgivelsesintelligens til generaliserbar intelligens (GI) i dag på re:MARS, Amazons konferanse om maskinlæring, automatisering, robotikk og rom.

Ambient intelligens, sa Prasad, er når underliggende AI er tilgjengelig overalt, hjelper people når de trenger det – og også lærer å forutse behov – for så å forsvinne i bakgrunnen når det ikke er nødvendig.

Et godt eksempel og et betydelig skritt mot GI, sa Prasad, er Amazons Alexa, som han beskrev som en “personlig assistent, rådgiver, følgesvenn.”

Den virtuelle assistenten er utstyrt med 30 ML-systemer som behandler ulike sensoriske signaler, forklarte han. Den mottar mer enn 1 milliard forespørsler i uken på 17 språk i dusinvis av land. Det vil også, sa han, være på vei til månen som en del av det ubemannede Artemis 1-oppdraget som skal lanseres i august.

En fremtidig Alexa-funksjon vil kunne syntetisere korte lydklipp til lengre story. Prasad ga eksemplet med en avdød bestemor som leste en godnatthistorie for et barnebarn.

“Dette krevde oppfinnelser der vi måtte lære å produsere en stemme av høy kvalitet med mindre enn ett minutts opptak kontra timer med opptak,” sa han. Han la til at det innebar å utforme problemet “som en stemmekonverteringsoppgave og ikke en talegenereringsbane,” sa han.

Ambient intelligens reaktiv, proaktiv, prediktiv

Som Prasad forklarte, er omgivelsesintelligens både reaktiv (reagerer på direkte forespørsler) så vel som proaktiv (forutsetter behov). Dette oppnår den gjennom bruk av en rekke sanseteknologier: syn, lyd, ultralyd, dybde, mekaniske og atmosfæriske sensorer. Disse blir så handlet på.

Alt i alt krever denne evnen dyplæringsevner så vel som naturlig språkbehandling (NLP). “Agenter” for omgivende intelligens er også selvovervåkende og selvlærende, noe som lar dem generalisere det de lærer og bruke det i nye kontekster.

Alexas selvlærende mekanisme, for eksempel, retter automatisk titalls millioner feil i uken, sa han – dette både kundefeil og feil i dens egne modeller for naturlig språkforståelse (NLU).

Han beskrev dette som den “mest praktiske” ruten til GI, eller evnen for AI-enheter til å forstå og lære enhver intellektuell oppgave som mennesker kan.

Til syvende og sist, “det er derfor omgivelsesintelligensbanen fører til generalisert intelligens,” sa Prasad.

Hva gjør egentlig GI-agenter?

Generaliserbar intelligens har tre attributter. GI “agenter” kan utføre flere oppgaver, utvikle seg til skiftende miljøer, og lære nye konsepter og handlinger med minimal ekstern menneskelig enter.

GI krever også en betydelig dose sunn fornuft. Alexa viser allerede dette, sa han: Hvis en bruker ber om å sette en påminnelse for Tremendous Bowl, for eksempel, vil den identifisere datoen for det retailer spillet samtidig som den konverterer den til sin tidssone, og påminn dem før den starter. Den foreslår også rutiner og oppdager uregelmessigheter gjennom “hunches”-funksjonen.

Likevel, understreket han, er GI ikke en “allvitende, all-capable” teknologi som kan utføre enhver oppgave.

“Vi mennesker er fortsatt det beste eksemplet på generalisering,” sa han, “og standarden for AI å strebe etter.”

GI er allerede i ferd med å bli realisert, påpekte han: Grunnleggende transformatorbaserte retailer språkmodeller trent med selvtilsyn driver mange oppgaver med langt mindre manuelt merkede knowledge enn noen gang før. Et eksempel på dette er Amazons Alexa Trainer Mannequin, som henter inn kunnskap fra NLU, talegjenkjenning, dialogprediksjon og visuell sceneforståelse.

Målet er å ta automatisert resonnement til nye høyder, med det første målet å være «gjennomtrengende bruk» av sunn fornuftskunnskap i konversasjons-AI, sa han.

I arbeidet mot dette har Amazon gitt ut et datasett for sunn fornuftskunnskap med mer enn 11 000 nylig innsamlede dialoger for å hjelpe forskning i samtaler på åpent domene.

Selskapet har også oppfunnet en generativ tilnærming som den anser som “tenk-før-du-snakker.” Dette innebærer at AI-agenten lærer å eksternalisere implisitt sunn fornuftskunnskap («tenke») og bruke en stor språkmodell (som det fritt tilgjengelige semantiske nettverket ConceptNet) kombinert med en kunnskapsgraf for sunn fornuft. Den bruker deretter denne kunnskapen til å generere svar (“snakke”).

Amazon trener også Alexa til å svare på komplekse spørsmål som krever flere slutningstrinn, og muliggjør også “samtaleutforskninger” på omgivelsesenheter slik at brukere ikke trenger å trekke frem telefonene eller bærbare datamaskinene for å utforske nettet.

Prasad sa at denne evnen har krevd dialogflytprediksjon gjennom dyp læring; web-skala nevral informasjon henting; og automatisert oppsummering som kan destillere informasjon fra flere kilder.

Dialogbehandleren for Alexa Conversations hjelper Alexa med å bestemme hvilke handlinger den skal ta basert på interaksjon, dialoghistorikk, nåværende enter og spørringer, spørringsstyrte og selvoppmerksomhetsmekanismer. Nevral informasjonsinnhenting henter informasjon fra forskjellige modaliteter og språk basert på milliarder av datapunkter. Transformatorbaserte modeller – opplært ved hjelp av et flertrinnsparadigme optimert for ulike datakilder – hjelper til på semantisk måte å matche spørringer med related informasjon. Dyplæringsmodeller destillerer informasjon for brukere mens de holder på kritisk informasjon.

Prasad beskrev teknologien som multitasking, flerspråklig og multimodal, noe som muliggjør “mer naturlige, menneskelignende samtaler.”

Det endelige målet er ikke naked å gjøre AI nyttig for kunder i deres daglige liv, males også enkel. Det er intuitivt, de vil bruke det, og kommer til og med til å stole på det. Det er AI som tenker før den snakker, er utstyrt med kunnskapsgrafer for sunn fornuft og kan generere svar gjennom forklarbarhet – med andre ord har evnen til å behandle spørsmål og svar som ikke alltid er enkle.

Til syvende og sist blir GI mer og mer realiserbar for hver dag, ettersom “AI kan generalisere bedre enn før,” sa Prasad.

For detaljhandel lærer AI å naked gå unna

Amazon bruker også ML og AI for å “gjenoppfinne” fysisk detaljhandel gjennom funksjoner som futuristisk palmeskanning og smarte handlevogner i Amazon Go-butikkene sine. Dette muliggjør «naked gå ut»-evnen, forklarte Dilip Kumar, visepresident for fysisk detaljhandel og teknologi.

Selskapet åpnet den første av sine fysiske butikker i januar 2018. Disse har utviklet seg fra 1800 kvadratfots bekvemmelighetsstil til 40.000 kvadratfot dagligvarestil, sa Kumar. Selskapet avanserte disse med sin Sprint Cart sommeren 2020, og med Amazon One høsten 2020.

Avanserte datasynsfunksjoner og ML-algoritmer lar people skanne håndflatene sine når de kommer inn i en butikk, plukke opp varer, legge dem i handlekurvene og deretter gå ut.

Håndflateskanning ble valgt fordi gesten måtte være tilsiktet og intuitiv, forklarte Kumar. Palmer er assosiert med kundens kreditt- eller debetkortinformasjon, og nøyaktigheten oppnås delvis gjennom undergrunnsbilder av veneinformasjon.

Dette gir mulighet for nøyaktighet i “en større størrelsesorden enn hva ansiktsgjenkjenning kan gjøre,” sa Kumar.

Vogner er i mellomtiden utstyrt med vektsensorer som identifiserer spesifikke varer og antall varer. Avanserte algoritmer kan også håndtere den økte kompleksiteten til “plukk og retur” – eller når en kunde ombestemmer seg om en vare – og kan eliminere omgivelsesstøy.

Disse algoritmene kjøres lokalt i butikken, i skyen og på kanten, forklarte Kumar. “Vi kan mikse og matche avhengig av miljøet,” sa han.

Målet er å “få denne teknologien helt tilbake i bakgrunnen,” sa Kumar, slik at kundene kan fokusere på purchasing. “Vi skjulte all denne kompleksiteten for kundene,” sa han, slik at de kan bli “oppslukt i handleopplevelsen, deres misjon.”

Tilsvarende åpnet selskapet sin første Amazon Fashion-butikk i mai 2022. Ved inngang til butikken kan kundene skanne varer på butikkgulvet som automatisk sendes til prøverom eller hentepulter. De får også forslag om ytterligere kjøp.

Til syvende og sist, sa Kumar, “vi er veldig tidlig i letingen vår, og vi presser grensene for ML. Vi har mye innovasjon foran oss.»

VentureBeats oppdrag skal være et digitalt bytorg for tekniske beslutningstakere for å få kunnskap om transformativ bedriftsteknologi og transaksjoner. Lær mer om medlemskap.

[ad_2]

admin

Leave a Reply

Your email address will not be published. Required fields are marked *