Undersökning av OCR Bibliotek
2020 (svensk)Independent thesis Basic level (degree of Bachelor), 10 poäng / 15 hp
Oppgave
Abstract [sv]
Den här rapporten handlar om att undersöka vilka för- och nackdelar med open source OCR-verktyg har jämfört med closed source OCR-verktyg. Krav på verktyg är att de ska 1) kunna utföra OCR, 2) kunna utföra OCR på många olika språk, 3) tillgodose ett API samt 4) kunna användas online.
Fyra verktyg valdes ut; Google Cloud Vision, Microsoft Computer Vision, Tesseract OCR och OCRSpace. För att testa dessa verktyg så utfördes tre olika experiment.
Resultatet av testerna visar att Google Cloud Vision och Microsoft Computer Vision ger bäst resultat när precision, det vill säga utläsning av antalet korrekta tecken. OCRSpace var det verktyget som var snabbat.
sted, utgiver, år, opplag, sider
2020. , s. 44
Emneord [sv]
OCR, Tesseract, Google Cloud Vision, Microsoft Computer Vision, OCRSpace
HSV kategori
Identifikatorer
URN: urn:nbn:se:hj:diva-48182ISRN: JU-JTH-DTA-1-20200100OAI: oai:DiVA.org:hj-48182DiVA, id: diva2:1425593
Fag / kurs
JTH, Computer Engineering
Veileder
Examiner
2020-05-062020-04-212020-05-06bibliografisk kontrollert