Röstgränssnitt – Hur, var och när kommer det att vinna (del 2)

John Ekman

Detta är del 2 i vår serie om röstgränssnitt. Om du läst del 1 kanske du, liksom jag, är övertygad om att röstgränssnitt kommer bli den tredje digitala revolutionen. Jag lovade även att berätta VAR och i VILKA SITUATIONER konsumenterna kommer välja att använda röstgränssnitt. Kul att du är tillbaka, för nu ska vi prata om det.

Till att börja med: Röst är inte lämpligt för alla typer av frågor och interaktioner.

– ”Ok Google – Välj en ny bil till mig”.
– ”Alexa – ge mig lite inspiration för en härlig resa nästa jullov”

Eh nä, det kommer ta ett tag innan vi får se det här hända, om någonsin.

Men det betyder inte att vi kan avfärda röstgränssnitt bara för att de inte funkar i vissa situationer och kontexter. Det gäller att hitta de fall där det kommer att funka riktigt bra.. Så vad är då det?

En motorväg med två filer till framgång

Jag brukar tänka att våra digitala interaktioner är som en motorväg med två filer. Och att båda är bra och framgångsrika. Bara helt olika.

1. Blow my mind

I det ena körfältet så försöker vi slå våra besökare med häpnad. Vi visar saker som de aldrig hade kunnat föreställa sig i sin vildaste fantasi. Saker blir virala och hakor tappas. Det här spåret har alltid varit favoritspåret för marknadsförare som älskar att vara kreativa och tänka ”outside the box”.

2. Get shit done

Till marknadsförarnas stora förtret så är konsumenterna allt som oftast bara upptagna med att ”Get shit done”. Du vet – handla mat, betala räkningar, anmäla barnen till fritidsaktiviteterna, frånvaroanmäla barnen till fritidsaktiviteten som du just betalade dyrt för och så vidare. Och det är här röst kommer att regera.

Så om du ute efter att slå besökarna med häpnad fortsätt att satsa på video och häftiga visuella presentationer. Om du tror att dina kunder kommer till dig för att lösa det så kallade livspusslet – satsa på röst.

Om du tror att dina kunder kommer till dig för att lösa det så kallade livspusslet – satsa på röst.

FAANG – leder vägen

Låt oss hämta lite inspiration från våra största tech-förebilder, Facebook, Apple, Amazon, Netflix och Google. Handlar de egentligen om ”Blow my mind” eller ”Get shit done”?

Facebook

Här är lätt att tänka ”Blow my mind”, eftersom Facebook är en oändlig ström av kattvideos och andra häpnadsväckande saker som vi förväntas klicka på. Men om man funderar på själva tjänsten i sig, som ju handlar om att lätt ta kontakt med andra personer. Man kan gå med i grupper för att hitta likasinnade, sätta upp event, vara med på event och sälja saker på marketplace. Ja – då kanske vi snarare skulle placera Facebook i ”Get shit done”?

Apple

Apple måste ju vara det ultimata ”Blow my mind”-företaget, med sina fantastiska produkter. Fast igen – om vi tittar bortom själva produktdesignen, så ser vi hur Apple gjort allt för att binda in sina användare i ett ekosystem av användarvänliga tjänster och mjukvara. Klockan sitter ihop med telefonen som sitter ihop med datorn som sitter ihop med iPaden som sitter ihop med iCloud. Allt ska vara smidigt att använda och nästan omöjligt att lämna. Det skulle jag kalla ett perfekt ekosystem för ”Get shit done”, eller?!

Amazon

Jag har beskrivit Amazon i andra bloggposter, och där kallar jag Amazon för ”världens mest friktionsfria ekosystem”. ”Get shit done” – helt klart.

Netflix

Netflix liknar Facebook på det sättet att innehållet är ”Blow my mind”, men sättet som det används för att få dig att konsumera deras innehåll om och om igen, faller snarare in under ”Get shit done”.

Google

Google – The place to get shit done – Mer behöver inte sägas.

Så när vi tittar på världens mest framgångsrika tech-företag, som vi traditionellt sett kanske ser som coola ”Blow my mind”-företag, så verkar det faktiskt som att de byggt mycket av sin framgång i ”Get shit done”-spåret.

Och som av en slump, så satsar i alla fall tre av den här företagen enormt mycket på röstgränssnitt.

Röstgränssnitt – Snabbare, lättare, simultant

Låt oss jämföra röstgränssnitt med textgränssnitt (aka. tangentbord på datorn).

1. Snabbare

Röst är nästan fyra gånger snabbare än text. Vi kan tala ca 150 ord/minut, jämfört med att skriva ca 40 ord/minut.

2. Lättare

Att tala kräver mindre kognitiv ansträngning än att skriva. Även om vi skulle kunna skriva lika fort som vi talade, så skulle det ändå vara jobbigare för hjärnan att skriva. Så genom att tala så minskar vi belastningen på vår överbelastade hjärna, fint va?!

3. Multitasking

När vi använder vår röst kan vi göra andra saker samtidigt som vi pratar. Vi kan laga mat, plocka upp barn som trillat, plocka ur diskmaskinen, köra bil. Ja, en hel massa saker som bara kräver våra händer men som går på autopilot i vår hjärna. Kanske är det just därför barnfamiljer är överrepresenterade användare av Amazon Alexa i USA?!

Buller och annat folk

Om vi funderar på vad som hindrar en från att använda rösten så är det framförallt två saker:

1. Buller

Stökiga ljudmiljöer med bakgrundsljud, musik och andra människor som pratar gör det mycket svårare för rösttjänsterna att ge ett korrekt resultat.

2. Annat folk

I dagsläget är det nog så att den största barriären mot att använda sin röst är att det känns ”socialt oacceptabelt” att hålla på och prata med sina prylar när andra människor är närvarande.

Let’s get to the point

Nu har vi radat upp en massa för- och nackdelar med röstgränssnitt, det är dags att komma till slutklämmen. – När, hur och var kommer det att fungera?

Jag har funderat fram och tillbaka och kommit fram till att röst kommer att bli en ”killer” i situationer och kontexter som karaktäriseras av fyra faktorer:

1. Saker som du inte behöver se

Röst fungerar bra när vi handlar eller utforska saker som vi inte behöver se. Det mesta av vår shopping och våra online-upplevelser idag är centrerade kring den visuella upplevelsen. Men det är faktiskt rätt mycket av det vi handlar som vi redan vet hur de ser ut eller så är det andra faktorer än utseendet som är den viktiga avgörande informationen.

2. Vanesaker

En underavdelning av saker som vi inte behöver se är saker som vi köper av vana. Om jag till exempel vet hur en ekologisk banan ser ut, så behöver jag inte se bananen, utan det räcker att min röstassistent frågar mig: ”Hur många ekologiska bananer vill du köpa?”.

3. Multitasking

Eftersom vi kan prata när vi gör andra saker på autopilot, och eftersom vi hela tiden försöker effektivisera vårt ”livspussel”, så kommer det att vara väldigt attraherande att till exempel kunna handla medan vi gör någonting annat med våra händer.

4. Stängda miljöer

Eftersom ” buller och annat folk” ställer till det för tekniken och för oss socialt, så kommer röst-gränssnitt att funka bra när vi kan stänga ute annat ljud och slippa vara pinsamma inför andra människor.

Din utmaning – hitta en kontext

Nu har du fått fyra ledtrådar till när röstgränssnitt kan fungera riktigt bra. Så nu kommer en utmaning:

  • Hämta en kopp kaffe, te eller annan lämplig dryck.
  • Fundera över de fyra ledtrådarna.
  • Försök sedan att hitta en kontext/ situation/användningsområde som bygger på de fyra ledtrådarna.

När du är klar kollar du på videon nedan.

Kom vi fram till samma sak?

 

Läs även