過去の図面や契約書などの紙資料をスキャンして、
PDF化は行っているものの、
画像PDFのままでは文字検索ができず、
「検索できるようになったらいいな」
と思ったことはありませんか?
AISpectを活用することで、
こうしたPDFを検索可能なPDF(サーチャブルPDF/Searchable PDF)にし、
実務で使いやすい形に整えることが可能です。
※検索可能PDFを検索する場合は、
Windowsの検索バーにキーワードを入力するだけで検索できます。
一般的なAI OCRの限界
検索可能PDFを作成するにあたり、
次のような処理も同時に行いたい方は多いのではないでしょうか。
- ファイル名を自動で付与したい
- 指定されたフォルダに保存したい
- 独自のキーワードを付与したい
- 一定ルールでテキストを変更したい
多くのAI OCRサービスでも検索可能PDFを作成する機能はありますが、
上記のような運用(業務ルール)が考慮されたサービスは、
多くありません。
AISpectで実現した処理
AISpectでは、検索可能PDFの作成だけでなく、
業務でそのまま使える形にするために、
以下の処理を組み合わせて実行しました。
- OCR処理による検索可能PDFの作成
- PDF内容に応じたファイル名の自動付与
- フォルダ監視による自動処理
処理の流れ
実際の処理は、以下のような流れで行われます。
- スキャンしたPDFを指定フォルダに保存
- AISpectが自動でOCR処理を実行し、検索可能PDFを生成
- OCR結果をもとにファイル名を自動生成
- 指定ルールに基づきリネーム
- 出力先フォルダへ保存
これにより、手作業を介さずに一連の処理を自動化することができます。
自動リネームの例
例えば、帳票内に記載された内容をもとに、
- 日付
- 会社名
- 書類種別
などを組み合わせたファイル名を自動で生成することが可能です。
例:
2026-05-01_株式会社〇〇_注文書.pdf
このように整理されることで、
フォルダを開くだけで内容が把握でき、
検索を行わずに目的のファイルへアクセスできるようになります。
複数様式への対応
実務では、帳票の形式が完全に統一されているケースは少なく、
同じ業務内でも複数の様式が混在することが一般的です。
AISpectでは、
- OCR処理(検索可能PDFの作成)
- 内容解析(リネーム用データ生成)
を分けて処理することで、
複数様式の帳票にも対応した運用が可能です。
様式ごとに個別設定を行うのではなく、
共通のルールで運用できる点も特徴の一つです。
検索用テキストの追加
AISpectでは、検索可能PDFのテキストに対して、
独自の検索用キーワードを追加することも可能です。
通常、OCRで生成される検索テキストは、
帳票内に記載されている内容がベースとなります。
しかし実務では、
- 社内管理番号
- 案件名
- 担当部署
といった、帳票には記載されていない情報で
検索したいケースも多くあります。
このような場合、
AISpectではPDFの検索用テキストに対して
任意のキーワードを追加することができます。
例えば、
- 図面には記載されていない社内図番を付与する
- 管理番号やプロジェクト名を追加する
といった運用が可能です。
活用ポイント
検索可能PDFの作成だけでなく、
- ファイル名の自動整理
- フォルダ運用との連携
- 帳票形式の違いへの対応
といった要素を組み合わせることで、
PDFをそのまま業務で活用できる状態にすることができます。
まとめ
AISpectを利用することで、
- 検索可能PDFの作成
- PDF内容に基づく自動リネーム
- フォルダ監視による自動処理
を組み合わせた運用が可能です。
検索や整理にかかる手作業を減らし、
スキャンしたPDFをそのまま業務で活用できる形に整えることができます。