帳票読み取り
帳票読み取り機能では、汎用的なAI機能を用いたOCRを実行することが可能です。
-
読み取り種別を選択してください
※ 読み取り種別を選択し、読み取り設定の保存ボタンを押下することで、次回起動時も初期選択されます
※ テキスト(全文)を選択した場合のみ、「レイアウトを識別し出力する」項目が表示されます
※ レイアウトを識別し出力するにチェックを入れると、文章全体を表形式と同じような形で出力できます -
読み取りたいファイルをドラッグアンドドロップしてください
・ 複数ファイルを同時に読み取ることも可能です
・ 読み取り状態が画面上に表示されます
・ 1ページ当たり10-20秒程度で読み取りが完了します -
処理が完了すると指定した保存先に保存されます(未設定時はデスクトップに保存されます)
・ 複数ページのPDFを読み取った場合は、1つのCSVにまとめて出力されます
・ ファイル名は読み取りファイルと同じ値が設定されます(請求書.pdf -> 請求書.csv)
・ 既に同名のファイルが存在する場合は、ファイル名に日時が付与されます(請求書20210101123015.csv)
・ 複数ページのファイルを読み取った場合、1つのファイルに結合されます
フォルダ監視
フォルダ監視を行うことで、指定したフォルダにファイルが格納されたのを感知し、読み取りが開始されます
フォルダ監視は事前にログインされている必要があります
-
監視先設定
・ 監視するフォルダと保存するフォルダを複数設定できます
・ 画面右側で値を設定し、追加または更新を押下すると明細に反映されます
・ 保存して閉じるを押下するとフォルダ監視設定が反映されます
※ 監視実行中に監視先の変更はできません-
モード
・ 新規:新たな項目を追加します
・ 編集:既に設定している項目を編集します。編集押下後に新規を押下すると値をコピーできます
・ 削除:既に設定している項目を削除します
-
設定項目
・ 監視先フォルダ:入力フォルダを指定します
・ 保存先フォルダ:出力フォルダを指定します
・ 移動先フォルダ:OCR完了後に元データを移動するフォルダを指定します(例:処理済みフォルダ)
・ 読み取り種別:読み取り種別を選択します。カスタマイズ版の場合は直接入力してください
・ レイアウトを識別し出力:テキスト(全文)のみ設定可能。テキストと表を分けて読み取ります
・ 罫線削除:罫線を削除して読み取ります。桁区切り線などでセルが分かれる場合に有効です
・ サブフォルダーも含める:監視先フォルダ内のサブフォルダも全て監視します
-
-
監視スタート/ストップ
・ 監視スタートを行うと監視が開始されます
・ 監視の停止を行う場合は監視ストップを行うか、プログラムを終了します
※ 監視中は常に実行パソコンにログインしている必要があります
-
実行後のバッチ処理
・ 監視するフォルダに aispect.bat ファイルを配置しておくと、読み取り完了後にバッチが実行されます
・ 処理完了時のメール通知やRPA実行などに利用できます
-
監視ログ
下記ファイルをインストールフォルダ(C:\ASAHI_RPA\AISpect)にコピーすることで実行ログを記録することが可能です
NLog.config (右クリックして名前を付けて保存を行ってください)
-
注意事項
・ 監視先フォルダがクラウドストレージ、NASでは正しく動作しない可能性があります
・ 最大フォルダー数の制限はありませんが、フォルダー数が多いと動作が遅くなる可能性があります
・ 監視先フォルダ、保存先フォルダ、移動先フォルダは必ず別フォルダを指定してください
項目指定
取得したい項目、例えば氏名や住所などのキーワードを指定することで該当の値を抽出します。
※ 項目名は完全一致でなくても抽出可能です。(図面番号→図番)
※ 表の抽出はできません。
-
項目指定欄に抽出したい項目を入力し、ファイルをドラッグアンドドロップしてください
-
一度設定した項目を保存する場合は設定保存ボタンを押下してください
-
保存済みの項目を呼び出す場合は、設定読読み込みから対象を選択してください
検索可能PDF
検索可能PDFで読み取りを行うと透明テキストが設定されたPDFが出力されます。
このPDFは、Windowsのエクスプローラーや文書管理システム※からPDF内のテキストで検索を行うことができ、図面管理や書類検索に大きく貢献します。
※ システムが全文検索に対応している必要があります
-
ファイルをドラッグアンドドロップしてください
-
保存フォルダにPDFが作成されます(同名のPDFが存在する場合は、PDF名の末尾に日時が付与されます)
画面キャプチャ
-
キャプチャを開始ボタンを押下してください
-
画面内の読み取り範囲をマウスでドラッグしてください
-
読み取りが完了したらEnterキーを押下してください。キャンセルはEscキーを押下します
-
読み取り結果が一覧に反映されます
-
読み取り結果の左側のボタンを押下すると読み取り結果をコピーします
-
右上のダウンロードボタンを押下すると読み取り結果を出力できます
※ 複数画像を選択した場合も、処理毎に1枚としてカウントされます
例)10項目を指定して確定→1枚としてカウント
読み取り設定
-
読み取り設定を行うことで様々な補正を行うことが可能です
-
次回以降も設定した内容を保持したい場合は、設定保存を行ってください
設定保存を行わない場合は、一時的な設定になります
■ 共通設定
結果補正
除外設定、ユーザー辞書設定、文字列置き換え設定の3つを設定することが可能です。(初期値:OFF)
除外設定
- 読み取り結果から特定の文字を除外することが可能です
- 文字は半角セミコロン(;)で複数指定できます
・ セミコロン(;)を除外する場合は、;;(セミコロンを2つ)を設定してください
置換設定
-
事前に置換設定をしておくことで、特定の文字を置き換えることが可能になります。
-
設定したいワードをタブ区切りで設定し、対象外にする場合は「//」を先頭に設定します。
-
置換設定変更後は、AISpectの再起動が必要です。
DPI
A0、A1サイズなど用紙サイズが大きい場合に、DPIを指定することで画像サイズを縮小することが可能です。
保存先設定
読み取り結果の保存フォルダを設定します。
実行履歴
実行履歴が正しく表示されない場合に、こちらから操作を行ってください。
■ 設定1
セル結合
-
隣接したセルを判断し値の結合を行います
-
同一枠内で点線などが含まれた帳票に有効な設定です
縦罫線除去
-
帳票内の縦罫線を除去して読み取ります
-
罫線として判断する条件は、罫線除去設定から設定できます
-
桁区切り線などが含まれた帳票に有効な設定です
横罫線除去
-
帳票内の横罫線を除去して読み取ります
-
罫線として判断する条件は、罫線除去設定から設定できます
-
数行ごとに横線が引かれている帳票に有効な設定です
罫線除去設定
罫線削除を行う際の条件設定と、テストを実施することが可能です
-
線とみなすための閾値
ある点とある点を結んだ際に何個の点がその中に含まれるのかを指定。値が小さければ線としてみなされやすく、値が大きければ線としてみなされにくくなります -
線とみなす最小の長さ
最小の線の長さを指定します -
線の間隔
細かな線が大量にある場合に、それらを一つの線としてまとめるための値。値を大きくするほど線としてみなされやすくなります -
描画する線の太さ
AISpectでは白いラインを線上に引くことで罫線を消しています。この際の線の太さを指定します。
スペース保持
Onにするとスペース情報も出力されるようになります
図面読み取り
図面に対する読み取り精度の向上が見込めます
※本設定の有効無効にかかわらず、オプションの費用はご請求対象となりますのでご了承ください
請求・注文・クレカ明細
ヘッダを読み取る
ONに設定すると、取引先名などのヘッダ情報を出力します。
取得内容は 読み取り種別 を参照してください
ファイル名を出力
ONに設定すると、1列目にファイル名を出力します。
出力レイアウトは 読み取り種別 を参照してください
追加項目設定
指定した項目を追加で読み取ることが可能です。
-
ボタンを押下するとメモ帳などのテキストエディタが起動します
-
最大20項目まで指定できます
-
先頭に//を入れると無効化(コメントアウト)が可能です
-
設定が完了したら上書き保存し、メモ帳を閉じてください
レシート
明細を読み取る
ONに設定すると、商品名などの明細情報を出力します。
取得内容は 読み取り種別 を参照してください
ファイル名を出力
ONに設定すると、1列目にファイル名を出力します。
出力レイアウトは 読み取り種別 を参照してください
■ フォルダ監視
フォルダ監視に関する設定を行います
スタートアップ実行
パソコンのログインした際、自動的にAISpectを起動します(このオプションを設定する場合は、AISpectを管理者権限で実行してください)
起動時に監視を開始
AISpectを起動した際に、自動的に監視を開始します
利用枚数確認
画面上部の利用枚数確認を押下してください
-
指定した期間の利用枚数を確認することが出来ます
※ 読み取りを行ってから反映されるまで最大1時間程度要します
サポート
サポート問い合わせフォームを起動します
障害情報
障害情報ページを表示します
バージョンアップ
最新版がリリースされると画面下部に通知が表示されます。
通知をクリックすると自動でプログラムのダウンロードが開始されます。
お知らせ
メンテナンス情報、アップデート情報などが通知されます。