Sta per aprire al pubblico il primo negozio Amazon Go. Niente code, niente casse. Ecco come funzionerà il nuovo retail fisico di Jeff Bezos.
Il primo punto vendita Amazon Go è già pronto: si trova a Seattle, all’angolo fra la Settima Avenue e Blanchard Street. Per ora a frequentarlo sono solo alcuni dipendenti di Amazon, coinvolti come beta tester; ma l’apertura al pubblico è prevista per la prima metà del 2017. Intanto possiamo farci un’idea del nuovo concept attraverso il sito web di lancio. Il principio è semplice: entri nel negozio, prendi ciò che ti serve e te ne vai. A registrare la merce acquistata e addebitarne il costo sul tuo conto pensa una serie di tecnologie invisibili ma potenti, a base di machine learning e computer vision. È l’intelligenza artificiale, bellezza!
Noi però non ci siamo accontentati del video promozionale. Abbiamo studiato le carte, spulciando fra i brevetti di Amazon, e abbiamo scoperto diverse cose interessanti. Ve le raccontiamo qui, in attesa di toccare con mano Amazon Go.
Un negozio senza casse
«No lines. No check out. (No, seriously)». Ossia: «Niente code, niente casse (davvero)». Suona così il claim che si ripete più volte nel video di presentazione di Amazon Go. In esso si mostra brevemente come si svolgerà la spesa all’interno di questi nuovi store e quali tecnologie verranno utilizzate.
Ma come funziona Amazon Go, dal punto di vista dell’utente? Nel sito viene spiegato in modo piuttosto semplice: «Use the Amazon app to enter, then put away your phone and start shopping. It’s really that simple. Take whatever you like, anything you pick up is automatically added to your virtual cart. If you change your mind about that cupcake, just put it back. Our technology will update your cart automatically».
In sostanza il consumatore dovrà per prima cosa installare sul proprio dispositivo l’app di Amazon go. Questa gli fornirà un QR code che verrà associato al suo account Amazon. Quindi l’utente avrà accesso al negozio attraverso il riconoscimento attivato dalla scansione del QR code personale. In seguito il cliente sarà libero di procedere allo shopping: ogni volta che un prodotto verrà inserito nella borsa oppure rimesso sullo scaffale, il carrello virtuale sull’app verrà aggiornato. All’uscita sarà generato uno scontrino virtuale per procedere al pagamento online. Quando i consumatori passeranno attraverso la transition area del negozio, i prodotti prelevati saranno registrati direttamente, senza dover passare dalle casse per il pagamento.
Che cosa c’è sotto
Nel video introduttivo si parla di diverse tecnologie che verranno inserite nella struttura dei negozi: «What if we can weave with the most advanced machine learning, computer vision and AI into the very fabric of a store so you never have to wait in line? […] We use computer vision, deep learning algorithms and sensor fusion».
Amazon non ha ancora svelato (e probabilmente non svelerà) tutti i “trucchi del mestiere” e in dettaglio come funzionerà il negozio. Ma un brevetto sviluppato dall’azienda nel 2015 parla di un insieme di tecnologie che potrebbero essere quelle sfruttate in questi nuovi store.
Il brevetto US 20150012396 A1 di Amazon, si intitola Transitioning items from a materials handling facility. Nell’estratto del brevetto viene descritto un sistema per la transizione automatica di oggetti da un deposito di materiali senza ritardare l’uscita da esso. Per esempio, mentre un utente si trova in una di queste strutture, può prelevare uno o più oggetti. Questi sono identificati e automaticamente associati con l’utente nel momento in cui vengono prelevati o in un momento appena successivo. Quando gli utenti passano attraverso un’area di transizione, i prodotti prelevati passano automaticamente in possesso dell’utente, senza la necessità di un input affermativo.
Vediamo quindi l’uso delle varie tecnologie. Perché, innanzi tutto, si parla di machine learning? Questo paradigma postula l’idea che le macchine siano in grado di eseguire operazioni per le quali non sono state programmate, grazie all’elaborazione di grandi quantità di dati. All’aumentare di questi, migliora la performance della macchina.
Nel caso specifico di Amazon Go, verranno applicati gli algoritmi di apprendimento in due diversi momenti:
1. All’entrata: nel punto [0038] del brevetto, si afferma che il sistema di gestione dell’inventario può identificare l’utente (ad esempio, attraverso il riconoscimento facciale oppure la carta d’identità virtuale costruita attraverso le informazioni fornite in passato dall’utente stesso). Una volta identificato l’utente, le informazioni (la sua storia precedente, la cronologia degli acquisti, profilo utente, le informazioni di pagamento) possono essere recuperate da un archivio dati.
2. Nel momento in cui il sistema non è in grado di riconoscere quale prodotto abbia effettivamente acquistato il cliente. Come fare? La risposta sta nel [0040] del brevetto. Con l’analisi dei dati relativi a spese precedenti, il sistema è in grado di capire qual è il prodotto scelto. Se negli acquisti precedenti un prodotto è già stato scelto oppure ne sono stati acquistati di simili, sarà più probabile che il cliente sceglierà un’altra volta quel prodotto.
Computer vision e sensor fusion
In seguito si parla di computer vision. Questo termine indica diversi metodi per acquisire, processare, analizzare e comprendere immagini digitali. In generale, ha a che fare con l’estrapolazione di grandi quantità di dati dal mondo reale al fine di produrre informazioni numeriche o simboliche in forma di decisioni. Siamo decisamente nel campo dei big data. In particolare, negli store dovrebbe essere applicato il punto [0018] del brevetto. L’identità degli elementi all’interno struttura può essere identificata in base ai dati ricevuti da una grande varietà di dispositivi di input. Ad esempio, un dispositivo di acquisizione delle immagini, una telecamera, può catturare una serie di immagini della mano di un utente prima che questa passi attraverso un piano di uno scaffale e in seguito quando viene allontanata dal ripiano. Sulla base di un confronto tra le immagini, si può determinare se l’utente abbia tolto o inserito un elemento dagli scaffali.
Ma tutto ciò non basta per l’analisi dei dati: vengono sfruttate anche le tecnologie di sensor fusion. Essa prevede la combinazione di dati sensoriali o dati derivanti da differenti fonti così che le informazioni risultanti siano meno incerte di quanto lo sarebbero se queste fonti fossero usate individualmente. Riduzione dell’incertezza in questo caso significa informazioni più accurate, più complete o più affidabili.
Sempre in riferimento al brevetto, al punto [0033] si parla di altri dispositivi di input, come sensori di pressione, sensori a infrarossi, celle di carico, sensori di spostamento di volume utilizzati in aggiunta alle telecamere. Ad esempio, i sensori di pressione possono essere utilizzati per rilevare quando viene aggiunto o prelevato un elemento. Oppure, celle di carico possono essere posizionate su una superficie della zona di transizione per rilevare quando un utente passa attraverso questa.
Proprio in riferimento a questa zona di transizione si collega la Just Walk Out Technology messa a punto da Amazon: «Once you’ve got anything you want, you can just go. When you leave, our just walk out technology adds up your virtual cart and charges your Amazon account. Your receipt is sent straight to the app and you can keep going». Nel punto [0044] del brevetto si parla infatti dell’uscita dell’utente dalla struttura passando attraverso una zona di transizione. Anziché richiedere la fermata dell’utente per confermare gli oggetti prelevati, è possibile semplicemente uscire con essi. Questo grazie al fatto che gli articoli sono già stati identificati e inclusi in un elenco identificatore sull’app dell’utente. A questo punto il sistema genera uno scontrino sul dispositivo dell’utente con l’importo finale.
Le tre V dei big data
Avendo analizzato tutte queste tecnologie possiamo affermare che siamo nel campo dei big data perché vengono soddisfatte le tre principali caratteristiche di questo paradigma:
VOLUME: grandi quantità di dati analizzati, dal profilo utente, il suo account, gli acquisti precedenti ai dati sui vari prodotti (che cosa sono, dove si trovano, a che utente sono associati);
VELOCITÀ: l’aggiornamento del carrello e il calcolo dell’importo avvengono in tempo reale;
VARIETÀ: le varie tecnologie utilizzate acquisiscono diversi tipi di dati che differiscono tra loro. Immagini per il riconoscimento dell’utente e del prodotto; dati sensoriali per identificare la presenza o meno di un prodotto su uno scaffale, dati numerici (il prezzo e il valore del carrello).
Non solo: siamo anche di fronte al tipico caso in cui una tecnologia è in grado di generare comportamenti tecnologici. Amazon Go causerà un nuovo modo di comportarsi nel momento della spesa. Essa sarà associata ad una serie di nuovi comportamenti tecnologici: scaricare l’apposita app e quindi utilizzare lo smartphone per poter accedere allo store e per controllare la corretta associazione di prodotti al nostro account. Tutto questo produrrà multidati, incamerati, elaborati e processati dalle tecnologie nello store.
Un negozio iperreale?
Questo scenario ci ricorda infine la riflessione di Keiichi Matsuda, Hyper Reality: a new vision of the future, incentrata sugli effetti della tecnologia su di noi e sugli spazi che abitiamo.
Siamo di fronte al rischio di avere dati che ci creano un guscio che determina lo spazio pubblico? Si arriverà ad avere un layer virtuale che si interpone tra noi e la realtà? Non possiamo saperlo. Aspettiamo l’apertura dei negozi di Amazon Go.
Il brevetto US 20150012396 A1 di Amazon è consultabile qui.