「生成AI OCR」という言葉に関して厳密な定義は存在していません。(2025年4月時点)
生成AI搭載OCRと記載されていたり、生成AI対応OCRであったりと言葉も様々です。
本記事では生成AIを搭載したAI OCR、生成AIとシームレスな連携が可能なAI OCRを生成AI OCRとして定義しています。
OCRの種類
はじめに、OCRの種類についてまとめてみます。
2025年現在OCRは以下のように分類分けされます。
OCRソフトウェア
昔からある従来型のOCR。
読み取り精度は低いが買い切り型のソフトウェア製品が多いため、安価で済む。
AI技術を採用しているものも出始めているが、AI OCRサービスと比べると読み取り精度は低い。
AI OCRサービス
AI技術により読み取り精度が格段に向上したもの。
手書き文字も高い精度で読み取れる。
クラウドまたはオンプレミスでのサービス提供が多い。
生成AI OCR
生成AIを使用することで、AI OCRに細かな指示ができるようになったもの。
抽出項目のキーワード指定や、出力時の加工も指示できる。
時代とともにOCR技術も進歩し、2025年時点で最新の技術が生成AI OCRとなります。
この技術は更に進化することが期待されるため、今後是非注目していきたい分野です。
AI OCRの機能と課題
では次に AI OCR の機能を見ながら、なぜ生成AI OCRが必要なのか見ていきましょう。
AI OCRでは、事前に位置を指定した項目の読み取り、全文読み取り、検索可能PDFの作成が主な機能でした。
しかし、フォーマットが多岐にわたる請求書や領収証(レシート)、注文書の場合、全ての取引先ごとに位置指定を行うのは現実的ではありません。
なかには読み取り位置が固定化されないケースもあり、そもそも位置指定できない場合もあります。
そこで、請求書読み取りモデル、レシート読み取りモデルなど種類毎に汎用AIモデルを開発することで、対応出来るサービスが多くなってきました。
これにより、フォーマットに縛られず、請求書などの読み取りが可能となります。
ですが、一般的な項目は読めるものの業種ごと特有の値には対応していないケースも多くあります。
例えば、車両関係の場合は「車体番号」、商社の場合は「バラ」や「C/S」、製造業の場合は「製番」などがこれにあたります。
そのため、必要な項目が読み取れない、という声は非常に多く聞かれる意見です。
また、AI OCRでは文字を読み取ることはできるものの、項目の意味を理解できません。
例えば、図面内の寸法を読み取りたいという場合に、AI OCRでは図面内のテキストを読み取ることはできても、それが図番、高さ、幅なのか理解できないため、項目別に出力することができません。
AI OCR=文字の読み取り、という点では確かに読み取れていますが、業務で活用できなければ意味がないことも事実です。
定型帳票や一般的な書類は読み取ることができるものの、内容を理解しないといけない帳票は読み取ることができないのがAI OCRの課題です。 (少し難しい言葉で表現すると、「構造化されていないデータ」はAI OCRでは読み取ることができません。 )
生成AI OCRについて
そこで、活躍するのが生成AI OCRです。
生成AIの最大の特徴は、AIに対して会話による指示ができることです。
これにより、普段の業務で同僚や部下とチャットでコミュニケーションを取りながら仕事をするような感覚で、AIと仕事を進めることが可能になります。
そして、その生成AIとOCRを組み合わせたものが生成AI OCRです。
簡単な例でみてみましょう。
帳票には「住所」という項目しかないのに対し、登録先のシステムには「都道府県」「市町村」「番地」と分けて登録をしなければならないとします。
AI OCRでは「住所」を読み取ることはできますが、それらを目的の形式に分割することはできません。
ですが生成AI OCRであれば「帳票から住所を読み取って都道府県、市町村、番地に分けて出力して」と指示を行うことで、AIが1つの項目を分割し出力することが可能となります。
また生成AIの種類によっては、図面の中から高さ、幅などの寸法情報を読み取らせたり、画像内の特定の図形の数をカウントさせる、ということも可能です。
このように従来のAI OCRと比べ、より細かく、よりほしい情報を、より柔軟に抽出できるようになったのが生成AI OCRです。
ChatGPTでもOCRは可能
ChatGPTでも画像をアップロードすることでOCRを行うことが可能です。
GPT4o、GPT4.1、GPT4.5に関しては、画像ファイルの読み取りも対応しているため、「画像の中から発注日を読み取って」のような指示を行うことで、特定の項目を読み取ることが可能です。
しかし、以下のような問題があります。
・読み取り精度が低い
・スキャンPDFが読み取れない
・上限がある
そのため、読み取りを主とした業務改善を行いたい場合は、生成AI OCRも視野に入れて検討することをオススメします。
生成AI OCRの価格例
多くの生成AI OCRでは基本料と生成AIの費用が分かれている事が多いです。
当社が提供するAISpectは自社利用を目的として開発されたサービスのため、非常に安価に利用することが可能です。
A社 | B社 | AISpect | ||
---|---|---|---|---|
基本料 | 80,000円 | 30,000円 | 10,000円 | |
生成AI利用料 | 10円/枚 | 10円/1000トークン | 10,000円/月額 |
※ 調査:2025年4月
AISpectについて
このように生成AI OCRを活用することで、様々な書類を読み取ることが可能となります。
AISpectでは、自社の業務効率化で得たノウハウをサービスに詰め込むことで、非常に高機能かつ使いやすさを実現しています。
またRPAと連携した後続作業の自動化のご支援も承っております。
紙や書類のデータ化にお困りのかたは是非一度ご相談ください。