Inhoudsopgave:
- Druk op 0 om met een mens te spreken
- Persoonlijke telefoon-apps: Siri, Google Now
- Waar VR platvalt
- Wat de toekomst in petto heeft
Heb je ooit een bedrijf gebeld om hulp te krijgen of je factuur te betalen, alleen om te worden begroet door een aangenaam opgenomen stem die een gesprek met je wil voeren - maar de helft van wat je zegt niet begrijpt? Of misschien heb je een iPhone, en terwijl Siri eerst een goede bondgenoot leek, ben je je gaan realiseren dat ze het soms (OK, laten we eerlijk zijn, vaak) niet begrijpt? Spraakherkenningstechnologie (VRT), ook bekend als spraak-naar-tekst, valt in een valkuil: het kan ongelooflijk cool zijn (en jongen, zoeken we het op), maar vaker is het tandenknarsen oefenen in frustratie.
Ooit een idee dat thuishoorde in het domein van science fiction, is stemherkenning gegroeid vanaf de kinderschoenen in de jaren 1950, toen Bell Laboratories Audrey-systeem werd ontworpen om cijfers te herkennen die met één stem werden gesproken, tot het moderne netwerk van conversatie-elektronica waarmee we nu communiceren op een dagelijkse basis - met gemengde resultaten.
Druk op 0 om met een mens te spreken
Veel van de bedrijven van vandaag gebruiken nu systemen die interactieve spraakrespons (IVR) worden genoemd om klantenservice-oproepen te behandelen. Het meest voorkomende gebruik is voor spraakgestuurde menu's, maar sommige bedrijven gebruiken IVR-systemen die toegang hebben tot klantaccountinformatie en kleine vragen kunnen beantwoorden. Menu IVR-software heeft meestal een beperkte vocabulaire, die mogelijk beperkt is tot "ja", "nee" en cijfers. Meer gecompliceerde systemen kunnen bedrijfsspecifieke woorden en zinnen herkennen.
Deze systemen worden steeds populairder - althans voor bedrijven - om een eenvoudige reden: ze zijn kosteneffectief. Volgens een rapport van de Wall Street Journal uit 2010 kost een typisch klantgesprek dat een agent bereikt tussen $ 3 en $ 9, terwijl een gesprek dat via een geautomatiseerd systeem wordt afgehandeld slechts vijf tot zeven cent kost. En natuurlijk worden computerprogramma's niet moe, worden ze niet ziek of raken ze niet gefrustreerd bij klanten (hoewel klanten zeker gefrustreerd raken!).
Gelukkig betekent dit niet altijd dat IVR banen van mensen wegneemt - of in ieder geval dat alle mensen uit callcenters verdwijnen. Met deze spraakgestuurde helpers kunnen medewerkers van de menselijke klant productiever zijn door oproepen te leiden en eenvoudige vragen te beantwoorden.
Natuurlijk is het voor de menselijke gebruikers die met deze technologieën omgaan niet altijd soepel varen. Technologie helpt bij het verbeteren van veelvoorkomende problemen in IVR-technologie, zoals problemen met accenten, maar het ontslaan van geautomatiseerde systemen is nog steeds een gemeenschappelijk thema online. Bekijk deze comedy-skit over een lift uitgerust met spraakherkenning, die de frustratie benadrukt die storingen in IVR-systemen kunnen veroorzaken.
Persoonlijke telefoon-apps: Siri, Google Now
De meeste mensen zijn bekend met spraakherkenning voor smartphones. Terwijl de meerderheid van de nieuwste telefoonmodellen met VR wordt geleverd, nam hun populariteit - en bekendheid - toe toen Apple Siri introduceerde, de mild sarcastische, spraakgestuurde 'persoonlijke assistent' voor de iPhone 4S in 2011. Google creëerde al snel een directe concurrent: Google Nu voor het Android Jelly Bean OS. Beide systemen hebben vrouwelijke stemmen en geavanceerde herkenningsfuncties waarmee gebruikers met hun telefoons kunnen "praten" in een informele taal.
Maar hoewel deze systemen aanzienlijk geavanceerder en functioneler zijn dan hun voorgangers, laten ze ook zien dat de technologie nog een lange weg te gaan heeft. Grappen over het falen van Siri zijn een populaire internetmeme geworden. Eén man klaagde zelfs Apple aan voor valse reclame over de mogelijkheden van Siri.
Misschien is dat waarom, terwijl Apple Siri creëerde om geavanceerd en informatief te zijn, de VR-software ook een beetje aan de brutale kant is. Als je bijvoorbeeld een van de meest beruchte intelligentietechnologielijnen uit de filmgeschiedenis uit de film '2001: A Space Odyssey' spreekt - 'open de deuren van de pod bay' - reageert Siri met de antwoordlijn uit de film, ' Het spijt me (uw naam), ik ben bang dat ik dat niet kan doen, 'of meer sarcastisch, ' wij inlichtingenagenten zullen dat blijkbaar nooit waarmaken. '
Je bij naam noemen is slechts een van de functies die Siri gemakkelijker te houden van liefde maakt, en een beetje menselijker. De VR-assistent kan spraakopdrachten volgen om te bellen, dicteren en sms'en, op internet zoeken naar informatie, winkels in de buurt zoeken, een routebeschrijving geven en meer, allemaal zonder iets aan te raken. Antwoorden worden tegelijkertijd door de telefoon uitgesproken en op het scherm weergegeven.
Google Now, het VR-gedeelte van het Android Jelly Bean-platform, lijkt sterk op Siri. Het systeem biedt dezelfde uitgebreide herkenningsmogelijkheden door informele spraak te vertalen in commando's waarmee gebruikers kunnen bellen, sms'en, zoekopdrachten uitvoeren, berekeningen en conversies uitvoeren, woorddefinities pakken, alarmen instellen, liedjes spelen en kaarten en routebeschrijvingen krijgen.
Met persoonlijke stemassistenten zoals Siri en Google Now zijn de voordelen duidelijk. Alles van bellen en sms'en tot zoeken en entertainment gaat sneller en eenvoudiger. Zeg gewoon wat je wilt en (meestal) grijpt de VR-app het voor je. De hands-off technologie van VR is vooral handig tijdens het rijden. En hoewel veel mensen Siri's tekortkomingen hebben ontkend, en schrijvers hebben aangevoerd dat het vermogen van Google Now om in wezen het leven van gebruikers te runnen beide een beetje beledigend is, vinden de meeste mensen nog steeds dat deze futuristische technologieën behoorlijk cool zijn.
Natuurlijk zijn apps voor persoonlijke telefoons zoals Siri en Google Now verre van perfect - hoewel ze laten zien waar deze technologie in de toekomst naartoe zou kunnen gaan. Dat betekent dat zelfs wanneer Siri een fout antwoord geeft, we waarschijnlijk zullen lachen en haar zullen vergeven, wetende dat de volgende versie veel beter zal zijn.
Waar VR platvalt
Als u ooit een IVR bent tegengekomen toen u een bedrijf belde, heeft u misschien bepaalde barrières voor communicatie opgemerkt. Sommige programma's gebruiken een robotachtige tekst-naar-spraak-stem die woorden verkeerd spreekt en dingen moeilijk te begrijpen maakt. Anderen hebben gevoeligheidsproblemen die ertoe leiden dat de software niet in staat is om te verwerken wat u zegt als u te luid, te zacht bent of niet zorgvuldig spreekt.
Bovendien voelen veel mensen zich gewoon niet op hun gemak wanneer ze met een machine praten. Als u een paar zoekopdrachten op IVR uitvoert, zult u lijsten tegenkomen die mensen hebben samengesteld om IVR-systemen te omzeilen en een 'echte persoon' te bereiken. Deze oplossingen variëren van "blijf op 0 drukken voor een operator" tot "vloeken op de machine totdat deze een mens ophaalt." Als gevolg hiervan is een groot deel van de recente ontwikkeling in IVR-systemen er omheen gegaan om ze voor mensen aangenamer te maken; waardoor de stemmen sympathieker en minder robotachtig zijn, waardoor het systeem gemakkelijker te navigeren is en bellers weten hoe lang het hele proces van begin tot einde zal duren. Dat suggereert dat de betere technologie hier slechts het halve werk is; de andere helft krijgt gebruikers aan boord om met een machine te praten.
Wat de toekomst in petto heeft
Ondanks deze uitdagingen wordt de technologie voor spraakherkenning steeds beter. Applicaties zoals Siri en Google Now - gebreken en dergelijke - zijn nog steeds buitengewoon indrukwekkend in hun prestaties, en verschillende bedrijven breiden VR-mogelijkheden uit naar andere applicaties.
Nuance, de makers van Dragon NaturallySpeaking spraak-naar-tekstsoftware, heeft bijvoorbeeld al spraakbesturing voor televisies en auto's ontwikkeld en versies van deze technologie zijn opgenomen in sommige Samsung-tv's en de SYNC-entertainmentsystemen die in bepaalde Ford-voertuigen worden gebruikt.
En terwijl Google en Apple nieuwe toepassingen blijven vinden voor hun spraakherkenningstechnologieën, is het waarschijnlijk dat we in toenemende mate met allerlei alledaagse machines zullen praten, van onze televisies tot onze broodroosters. En nogmaals, het lijkt erop dat science fiction gelijk had. We moeten gewoon hopen dat die slimme schrijvers over één ding ongelijk hadden. Als deze machines het overnemen, kun je de volgende keer dat je Siri vraagt 'de deuren van de pod bay te openen' in veel problemen zitten.