Trots alla nedböjda huvuden och lätt upplysta ansikten på bussar, tunnelbanevagnar och kaféer, närmar vi oss det skärmlösa samhället. Och oddset för att familjen får en intelligent högtalare i form av en Google Home i julklapp är ganska lågt.

I år kommer det att säljas 75 miljoner smarta högtalare, mest från Google och Amazon, enligt analysfirman Catalyst. Även kinesiska Alibaba har tagit fram smarta högtalare. Samtidigt har över en miljard prylar med röstgränssnitt, där Google Assistent leder före Siri, Amazon Alexa och Microsoft Cortana. Nyligen lanserade Amazon en mikrovågsugn som går att prata med.

20 procent av sökningarna i USA är idag röstsökningar. Det är ofta enklare att tala in en sökning – särskilt när du kör bil eller går. Men det vanligaste användandet av intelligenta högtalare är att sätta på musik och det näst vanligaste är att fråga om vädret, följt av roliga nonsensfrågor och först därefter kommer seriösa sökningar.

I Sverige har vi hamnat lite i bakvattnet till USA ifråga om röstgränssnittet, men i augusti lanserades Google Assistent på svenska. Och den smarta högtalaren Google Home på svenska går nu att köpa hos Elgiganten. Några av de svenska bolag som är först ut med att koppla sina tjänster till Googles plattform är SJ, H&M, Sveriges Radio, SAS och Ica.

Google Assistent talar svenska, men få svensktalande användare gör att det tar tid att för den artificiella intelligensen att faktiskt lära sig språket ordentligt. Google Assistent vägrar exempelvis att uttala mitt namn rätt. Den betonar andra stavelsen till Urbaan – sjukt irriterande.

Det är Google Assistent, Siri och Amazon Alexa som kommer att rädda oss från tidernas största drogberoende – mobilberoendet. När röstgränssnittet slår igenom fullt ut kan vi äntligen förflytta våra mobiler till bakgrunden – där de hör hemma. Att prata är enklare än att skriva för de flesta – vi pratar 150 ord i minuten och skriver normalt max 100 ord i minuten. Vi har också lättare att prata samtidigt som vi gör något annat. När vi skriver försvinner vi ner i skärmen och omgivning försvinner för oss.

Röstförståelse har en lång förhistoria. Redan på 1950-talet skapade IBM maskinen Audrey, som upp till 90 procent kunde förstå siffrorna 1 till 9. Det var egentligen först 1997 som mjukvaran Dragon kunde förstå pågående tal och uppfatta upp till 100 ord i minuten. Vanligt tal ligger på 150 ord i minuten.

Tekniken med maskininlärning gjorde det möjligt för Google att 2008 lansera Google Voice Search-app. Men det var egentligen först med Apples Siri som användarna börja gilla tekniken. Amazon Alexa kom 2014, men är den digitala assistent som gjort mest för att sprida de intelligenta högtalarna i USA. I Sverige är det bara riktiga nördar som brytt sig om att importera en Alexa. Idag arbetar 10 000 människor med Alexa. Och försäljning via Alexa är på väg att bli en 35 miljarder-business.

Själv ser jag fram emot när skärmarna blir ett komplement till vår omvärld och inte det all uppmärksamhet fokuserar på. Det skärmlösa samhället är inte långt borta.