OCRとは
OCRとは簡単に言うと「文字を読み取る技術」です。
言葉を知らない、というかたも学生時代にマークシートを使ったことがある方は多いと多いと思います。
マークシートを読み取る技術は OMR と呼ばれ、指定された位置の印を読み取ります。
一方 OCR では、文字そのものを読み取る ことができます。
お客様から受領した資料の転記や、データ化の効率化を行いたいかたにうってつけの技術です。
ですが、これまでのOCRは、読み取り精度がそこまで高くありませんでした。
OCR製品で活字を読み取った場合、良くて6~8割の読み取り精度、用紙の状態にもよっては全く読まない、というケースもあります。
そして、読み取り精度を上げるためには 専用のフォント を使用する必要があるなど、汎用的には活用できなかったのが事実です。
AI技術との融合
そこで AI技術 を用いることで、 読み取り精度を格段に向上 させたのが 「AI OCR」 です。
AI OCR は 9割以上の識字率 が一般的となっており、活字以外にも、手書き文字や写真で撮影した紙の文字など、業種を問わず様々なケースに対応が出来るようになりました。
以前はフォーマットが決まった帳票(定型帳票)に対し、読み取り位置を指定して読み取る仕組みが一般的でしたが、近年では請求書などの準定型帳票、契約書などの非定型帳票に対応したサービスも登場しています。
-
「定型帳票」フォーマットが決められた帳票
例:運転免許証、申込書 -
「準定型帳票」フォーマットはバラバラだが一定の決まりがある帳票 例:請求書、住民票、預金通帳
-
「非定型帳票」帳票によって形式がまったく異なる帳票
例:契約書、入札公告
AI OCR で読み取られている帳票
AI OCRは汎用的に利用ができるため、上記以外にも様々な帳票に対して利用されています。
- 図面
- 利用申込書
- 注文書
- 住民票
- 入学願書
- アンケート
AI OCRの価格と性能
AI OCR はTesseract(テッセラクト)のように無料で利用できるものから、AISpectのように数千円で利用できるサービス、SmartReadのように非常に高い読み取り精度を誇るものまで、非常に多くのサービスやソフトウェアが存在しています。
- AISpect 月額5,600円
- SmartRead 月額当たり30,000円
- Tesseract 4 無料
そして、ほとんどの場合、製品価格と読み取り精度は比例関係にあると言えるでしょう。
例えば、Tesseractでほとんど読めない手書きの帳票も、AISpectやSmartReadでは高精度に読み取ることが可能です。
参考までに Power Automate for desktop で使用できるTesseract、Windows OCRと、AISpectの読み取り結果を比較した画像を掲載します。
今回の画像は手書き文字となっているため、TesseractやWindows OCRではほとんど読めていませんが、AI OCRであるAISpectでは正しく読めていることが分かります。
また、読み取り精度以外にも、AI OCRには帳票を認識する機能が備わっている製品があります。
例えば、AISpectのカスタマイズ版では、請求書や注文書、納品書などが混在していても、帳票の種別をAIが理解して読み取りを行うため、事前に仕分けを行う必要がありません。
まずは実際の帳票を使って読み取ってみて、満足できる読み取り精度が出るか、予算内に収まるか、費用対効果はどうか、など様々な視点から、どの製品を選ぶかを決めると良いでしょう。
RPAとの連携
AI OCRで読み取ったデータはRPAと組み合わせることで、その先の業務も自動化することが可能です。
例えば、以下のケースが考えられます。
- FAXで届いた注文書を読み取って受注入力を行う
- 請求書の金額を読み取ってシステムの入力値と突合する
- 図面のBOM情報を生産管理システムに転記する
このようにこれまで人が手作業で行っていた業務の多くを自動化することが可能になります。
Microsoft Power Automate for desktop は無料で開始することができるため、すぐに自動化に取り組むことが可能です。
そして必要に応じて有償ライセンスに切り替えることで、業務自動化の範囲をさらに広げることが可能となります。
また後続処理の自動化以外にも、OCRの読み取り精度上げる、ということも可能です。
AIには読み取りのクセというものが存在します。
例えば、「0C1(ゼロ・シー・イチ)」を「001」と読んでしまうAIは、「00I(ゼロ・ゼロ・アイ)」と読むケースはほとんどなく、毎回同じ様に「001」と誤読してしまいます。
AIを学習できればベストではありますが、SaaSの場合は、自分で学習できないケースもあるため、
その場合はRPAを使って文字列を補正することで精度の向上が図れます。
AI OCR にお困りの方へ
当社では、実際に自社グループで活用しているノウハウをもとに、最適なAI OCRのご提案を行っております。
- これって読めるのかな?
- 導入したけどうまく活用できていない
- 費用が高くて困っている
- RPAと連携したいけどよくわからない
など、OCRに関するお困りごとがございましたらお気軽にご相談ください。
また、AISpect では Power Automate for desktop との連携をサポートしており、より多くの業務効率化に貢献いたします。