En kvinne som bruker Orcam MyEye2 for å lese fra et hefte (Foto: Jørn Stadskleiv)

Kroppsbåren og bærbar OCR

Morten Flatebo Lese- og skrivestøtte, Syn, Teknologi

En omtale av OCR-teknologien og noen løsninger (mest apper) som leser tekst og tolker omgivelser for personer med nedsatt syn.

Av spesialpedagog Frank Lunde, NAV Hjelpemiddelsentral Østfold

Om OCR

OCR er en forkortelse for Optical Character Recognition. Wikipedia definerer OCR som «en teknikk for elektronisk eller maskinell oversettelse av trykte bokstaver eller håndskrift». OCR brukes altså til å oversette trykt tekst til data som kan behandles i en datamaskin, for eksempel i en tekstbehandler. OCR har eksistert lenge, men helt fram til datateknikken ble allment tilgjengelig var teknologien kun på eksperimentstadiet.

OCR ble sent på 70-tallet forsøksvis tatt i bruk i produkter designet for personer med store synshemminger. På sent 80-tall kom produkter som koblet OCR sammen med syntetisk tale. De første lesemaskinene for blinde kom i salg i Norge tidlig på 90-tallet. Dette var stasjonære enheter som så ut som store skannere, som enten var ment å kobles til en datamaskin, eller brukes som en frittstående lesemaskin. Den OCR-behandlede teksten ble lest opp av en syntetisk stemmer eller sendt som en tekstfil til datamaskinen.

Siden 90-tallet har det skjedd mye med datateknologien: Prosessorkapasitet og minne har utviklet seg til at vi nå til hverdags i våre smarttelefoner, bærer med oss datakraft som for 25 år siden var utenkelig andre steder enn i store datasentraler på et universitet eller hos en leverandør av datatjenester til banker. Dette har forandret verden, også når det gjelder OCR.

Hjelpemiddelindustrien har utviklet produkter som f.eks. kan monteres på en brille, og som kan lese tekst og tolke omgivelser for brukeren. Dette er løsninger som utnytter det vi kan kalle kroppsbåren teknologi.

Apputviklere har utviklet apper for nettbrett eller smarttelefon som raskt og enkelt gjør det samme som hjelpemidlene. I denne artikkelen ser vi på hvor teknologien befinner seg nå på dette området, og vi presenterer noen av løsningene. Hvis du leser dette etter i 2021 eller senere, kan du regne med at denne informasjonen er utdatert, og du bør hente informasjon om dette fra andre kanaler. Vi er nå i 2019 og utviklingen av datateknologi skjer fortsatt i et eskalerende tempo. Moores lov anno 1965 gjelder fortsatt. 

Bærbar OCR

Med bærbar OCR mener vi i denne sammenhengen apper til smarttelefoner eller nettbrett som tar i bruk OCR på en måte som er ment å være nyttig for den som av en eller annen grunn ikke kan lese tekst ved å bruke blikket. OCR utnytter maskinvare og funksjoner i smarttelefonen som opprinnelig ble utviklet med tanke på andre ting enn OCR. Dette er funksjoner som finnes i de fleste smarttelefoner som leveres i dag:

Kamera
Moderne smarttelefoner har kamera med høy oppløsning, som er velegnet til dette bruk. Slike kameraer et utstyrt med automatisk fokus og blender, slik at brukeren ikke trenger å se for å få til et bilde som kan tolkes.

Kamerastabilisator
Har du problemer med å holde kameraet i ro kan denne funksjonen hjelpe deg. Løsningen har sine begrensninger, men for mange er det en hjelp.

Lys
Kameralyset hjelper til å få tydeligere bilder når du bruker telefonen i mørket. De fleste nettbrett mangler kameralys.

Stillingssensor
Denne funksjonen hjelper deg å holde kameraet i riktig posisjon over teksten du skal OCR-behandle.

Internett-tilkobling
OCR-appene kan utnytte ressurser på nettet for å bedre resultatet av OCR-behandlingen. Dette er gjerne ressurser som leveres av apputviklere. Noen apper krever at du har internett-tilkobling for å fungere.

Lagring
Mange smarttelefoner har stor lagringskapasitet som kan utnyttes av denne typen apper. Dette kan være nyttig fordi datasett som brukes av OCR-appen kan lagres på enheten, og internett-tilkobling er derfor ikke nødvendig. Dermed sparer man kostnaden med datakommunikasjonen via mobilt bredbånd.

Deling
Teksten som er resultatet av OCR-behandlingen kan deles via den innebygde delingsfunksjonen til andre personer, tekstbehandler, meldinger og mye mer.

Lydopptak
Den oppleste tekst kan lagres som lydfil og leses opp ved en senere anledning.

Tilgjengelighet
Moderne smarttelefoner har innbygde tilgjengelighetsfunksjoner. Disse kan gjøre det mulig for personer med ulike funksjonsutfall å bruke telefonene. En OCR-app kan benytte seg av tilgjengelighetsfunksjoner som

  • tekst til tale
  • skjermleser
  • skjermtilpasning
  • kamerastabilisator
  • trykktilpasning

Les mer om tilgjengelighet i andre artikler på kunnskapsbanken.net.

Det finnes etter hvert mange apper til ulike formål med innebygget OCR. De appene som vi nevner her er alle nærmere beskrevet på nettstedet appbiblioteket.no, og er laget til bruk for personer som av en eller annen grunn ikke kan lese vanlig tekst.

Skjermdump av appen KNFB Reader
KNFB Reader

KNFB er en forkortelse som står for Kurtzweil National Foundation for the Blind. Ray Kurtzweil er en amerikansk gründer og oppfinner og han er en pionér innen dette feltet. Hans selskap laget denne appen i samarbeid med Norges Blindeforbunds amerikanske søster.

Appen har vært mye brukt, og har vært populær blant blinde og sterkt svaksynte. Appen tolker tekst meget raskt og nøyaktig, den har mange funksjoner/innstillinger som gjør den velegnet for personer som ikke kan se, og den trenger ikke være koblet til internett for å kunne tolke tekst. Apputvikleren har sørget for at appen på en god måte utnytter egenskapene i smarttelefonen som nevnt tidligere i artikkelen.

Dessverre er appen ganske kostbar, men for den som oppfyller kravene til å få synshjelpemidler fra NAV, kan det være mulig å få appen som hjelpemiddel. Forutsetningen er at appen er nødvendig og hensiktsmessig for den det gjelder.

Les mer om KNFB Reader på appbiblioteket.no

Skjermdump av appen Office Lens
Office Lens

Microsoft har laget denne appen til mange plattformer, og er nært knyttet til Microsoft Office 365. Appen er gratis. 

Office Lens er laget med tanke på brukere uten spesielle behov, men den støtter skjermlesere på en god måte og kan dermed fungere godt for den som ikke kan se. Etter at man har tatt bilde av dokumentet/tavlen/visittkortet, kan man velge hvordan dokumentet skal behandles videre. Et av valgene er «Engasjerende oppleser». Her vil bildet OCR-behandles, og teksten leses opp. Du kan også sende dokumentet videre til et Office-program som må være installert på telefonen din.

Office Lens mangler funksjoner som kan gjøre det enklere for en blind person å betjene appen (som KNFB Reader har), men kan likevel være nyttig for noen. For personer uten synsproblemer fungerer den godt.

Les mer om Office Lens på appbiblioteket.no

ClaroSpeak Plus

Denne appen er laget med tanke på personer med lese- og skrivevansker. Den har et enkelt og oversiktlig skjermbilde, og kan importere tekster fra mange ulike kilder, inkludert fotografier og fra kamera. I importfasen blir bildet OCR-behandlet, og teksten vises på i avspillingsvinduet.

ClaroSpeak Plus har få funksjoner, og appen koster noen kroner. I tillegg finnes det her en rekke «Kjøp i app» som tilfører nye funksjoner. Undertegnede kunne ikke få til et bra resultat av OCR-funksjonen, og har problemer med å anbefale denne appen til dette bruk.

Les mer om ClaroSpeak Plus på appbiblioteket.no

Skjermdump av appen ClaroSpeak Plus
Skjermdump av appen ClaroSpeak Plus
Skjermdump av appen Seeing AI
Seeing AI

Microsoft har satset stort på utvikling av såkalt Ariftificial Intelligence eller AI. I denne satsingen har appen Seeing AI blitt til. Den er laget med tanke på blinde, men andre kan også ha nytte av deler av denne appen. Seeing AI har flere kanaler som gir en blind person informasjon om sine omgivelser. To av disse utnytter OCR-teknologi. Det er «Short Text» og «Document» og «Handwriting».

Short Text leter etter tekst i bilderuten, og leser den opp automatisk så snart den dukker opp. Dette kan være hva som helst av tekst, og den skiller ikke om den står på en skjerm, på siden av en buss eller i et bilde i en avis.

Document hjelper deg å finne omrisset av et ark, og tar automatisk bildet når alle hjørnene på arket  er innenfor bildeområdet.

Handwriting (håndskriftgjenkjenning) er et område som er i rivende utvikling for tiden, men i skrivende stund fungerer den dårlig på norsk.

Seeing AI har enda ikke et norsk brukergrensesnitt, men kan nok likevel være nyttig for mange. Short Text leses opp på norsk dersom man bruker VoiceOver på norsk.

Les mer om Seeing AI på appbiblioteket.no

Skjermdump av appen Prizmo Go
Prizmo Go – Instant Text OCR

Denne appen er laget til personer uten spesielle behov, men den fungerer godt sammen med VoiceOver.

Den har et engelsk brukergrensesnitt, men man kan laste ned OCR for mange andre språk inkludert norsk. Den leverer resultatet raskt og med god kvalitet.

Appen er i utgangspunktet gratis, men man kan kjøpe ekstra funksjoner inne i appen.

Les mer om Prizmo Go på appbiblioteket.no

Kroppsbåren OCR

Vi legger i dette begrepet hjelpemidler som bæres på kroppen, og som ved behov tolker tekst som er i brukerens omgivelser. Dette er dedikerte hjelpemidler som det er mulig å få fra NAV, dersom man oppfyller kriteriene for å få den, og hjelpemiddelet er nødvendig og hensiktsmessig. Dette er nye teknologi, og hjelpemidlene er for tiden kostbare. Derfor vil NAV måtte vurdere om andre løsninger kan være nyttig for brukeren, og kanskje anbefale dem framfor kroppsbåren OCR.

Foreløpig er det kun et produkt av denne type som selges i Norge. Det kan komme flere etter hvert som teknologien blir mere moden.

Orcam MyEye2

MyEye2 er et lite kamera som festes på en brille. Det har en innbygget datamaskin som behandler kamerabildene, tolker bokstaver, gjenkjenner ansikter og objekter. MyEye2 kan også skanne strekkoder på produkter og gi brukeren informasjon om dette. Brukeren får informasjonen fra kameraet via lyd fra en liten høyttaler eller fra en Bluetooth høretelefon. Hjelpemiddelet betjenes med gester foran kameraet og via en berøring på selve kameraet. For å få lest opp en tekst må brukeren holde opp en finger like under der man ønsker at opplesingen skal begynne. For å stanse opplesingen holdes hånden flatt opp foran kameraet. MyEye2 har en rask og nøyaktig tolking av tekst, og kan lese plakater, tekst på papir og på skjerm eller lerret.

En kvinne som bruker Orcam MyEye2 for å lese fra et hefte (Foto: Jørn Stadskleiv og Hege Grimsøen)
Kamera med OCR. Orcam i bruk. (Foto: Jørn Stadskleiv og Hege Grimsøen)

I og med at man må vite hvor teksten er for så å peke på dette stedet, har produkter noen begrensinger i forhold til hvilke brukere som kan benytte seg av det. MyEye2 blir vanskelig å bruke for den som er helt blind og ikke kan skimte hvor teksten befinner seg hen. En annen begrensing er betjeningen av berøringsfeltet på selve kameraet. Her navigerer man i menyene til produktet, og gjør endringer i oppsettet. Dette berøringsfeltet er svært følsomt, og for en person med litt begrensinger i håndmotorikken, kan det være vanskelig og håndtere menyinnstillingene.

Dette er teknologi som en tidlig fase, og vi har grunn til å håpe at den blir bedre og nyttigere med tiden. Som nevnt fungerer OCR biten greit, men det er betjeningen og funksjonaliteten som så langt setter noen begrensinger.

Konklusjon

I appbiblioteket.no har vi presentert noe få apper med OCR som kan være nyttig for personer med synshemming. Vi vet at det finnes flere, og at utviklingen gjør teknologien stadig bedre. Smarttelefoner har gjort at OCR har kommet seg ut av brukerens hjem eller arbeidsplass, og er nå med han over alt der han ferdes. Dette er en viktig og gledelig endring for de som ikke kan lese vanlig skrift. Kroppsbåren OCR i et enda mindre fysisk format er fortsatt i en tidlig fase og det gjenstår å se hvor nyttig dette kan bli.