アナログとデジタルが混ざり合う現代では、これらの世界をつなぐ技術が重要です。OCR(光学文字認識)はその一つであり、多くの業界を変える可能性を秘めています。時代に乗り遅れないように、今知っておきたいOCRの知識・情報を押さえていきましょう。
目次
OCR(光学文字認識)とは?テキストデータ化の仕組み
OCR(Optical Character Recognition)とは、現実世界の紙などに書いた文字をテキストデータに変換する技術です。日本語では「光学文字認識」と訳されており、すでにさまざまな業界で活用されています。
OCRで生成したテキストデータは、パソコンやスマートフォンなどの端末で閲覧できます。プレーンテキスト(※)としても活用できるため、そのまま他のソフトウェアにコピー&ペーストをしたり、プリンタで印刷したりすることも可能です。
(※)パソコン上の一般的なフォーマットにあたる、装飾情報などを持たない文字だけのデータ。
レイアウト分析や照合作業を経て、紙の文字がテキストデータ化される
具体的なイメージをつかむために、実際のOCRサービスによるテキストデータ化の流れを見ていきましょう。
<OCRによるテキストデータ化の仕組み>
1.スマートフォンやスキャナなどを用いて、紙に書かれた文字の画像データを作成する。
2.区切り線や折れ線、図表などを排除するために、レイアウト分析が行われる。
3.行や列、文字同士の区切り部分などを細分化し、文字のまとまりとして認識する。
4.デジタル文字と照合しながら、一つひとつの文字を認識する。
5.認識した文字をテキストデータとして出力する。
テキストデータとして出力する際には、もとのレイアウト(行や列など)が再現されます。つまり、1文字単位ではなく「文字のまとまり」として出力されるため、画像データによっては元のレイアウトに近い形でテキスト化されます。
OCR(光学文字認識)を導入する5つのメリット
OCRサービスには多くの導入メリットがあり、パソコンなどの機器やソフトウェアとうまく組み合わせれば、さまざまな経営課題を解決できます。実際にどのような効果を期待できるのか、ビジネスシーンでの主なメリットを見ていきましょう。
メリット1.ITスキルがなくても簡単にテキストデータを作れる
OCRは、企業のペーパーレス化を加速させる技術です。手書きの文字がすぐにデータ化されるため、パソコンなどの操作に慣れていない人でも、テキストデータとしての見積書や請求書などを簡単に作成できます。
ITスキルに左右されるシーンを減らせるので、企業にとっては人材活用の幅を広げる施策になるでしょう。
メリット2.紙の保管スペースを節約できる
すべての資料を紙にすると、きれいにファイリングしても資料室が散らかったり、デスクに山積みになったりなどの弊害が生じます。乱雑な書類管理は紛失や漏えいリスクにつながるため、本来であれば適切な場所で保管をしなければなりません。
その点、OCRではデータとして資料を保管できる(=紙の資料が減る)ため、貴重な保管スペースを節約できます。
メリット3.参照したい文章やデータを検索できる
OCRで出力されたテキストデータは、特定のワードや数値で検索できます。参照したい文章やデータをすぐに発見できるため、地理情報や販売情報、顧客データなどの管理に向いているでしょう。
一方で、請求書などを手書きのままで保管する場合は、目当ての資料を探すだけで大きな労力がかかってしまいます。
メリット4.ヒューマンエラーを見つけやすくなる
OCRでテキストデータ化をする場合は、「手書きで文字を書く」と「データとして出力する」の2つのプロセスを挟みます。データ化してから確認作業をすれば、書き手と読み手の2人がチェックすることになるため、誤字・脱字などのヒューマンエラーを察知しやすくなります。
また、IT分野に疎い人材が多い企業では、キーボードによる入力を避けるだけでミスを減らす効果があるでしょう。
メリット5.テキストの編集や再利用が容易になる
紙に書いた文字を編集するには、消しゴムや修正液で消したり、二重線を引っ張ったりなどの訂正作業が必要です。一方で、テキストデータは端末上(パソコンやタブレットなど)で自由に編集できるため、内容に変更が生じても大きな手間にはなりません。
また、売上などの数値データを取り込む場合は、表やグラフを作成することで簡単に分析できます。
OCR(光学文字認識)の導入で注意したいデメリット
OCRサービスの導入にはコストがかかるため、費用対効果の高いシステムを選ぶことは必須です。仮にシステム選びや導入範囲を誤ると、かえって業務効率が下がるリスクも考えられます。
ここからは導入時に注意したいデメリットをまとめたので、一つずつ確認しながら計画を立てていきましょう。
デメリット1.読み取り精度が低いシステムもある
OCRの読み取り精度は、利用するシステムによって異なります。手軽に利用できるサービスも増えてきましたが、そのすべてが高い精度を備えているわけではありません。
特に注意したいのは、アルゴリズムや仕様による違いです。以下のように、OCRはシステムのタイプが変わるだけで、読み取り精度や識別できる文字が変わってきます。
<OCRの主なタイプ>
1.単純な光学文字認識
文字やフォントのパターンでテンプレートを作成し、文字ごとにテンプレートと比較しながら認識をするシステム。保存できるテンプレートに限りがあるため、ほかのタイプに比べると読み取り精度が低い。
2.インテリジェント文字認識
機械学習をとり入れることで、さまざまなレベルでの文字認識を可能にしたシステム。1文字ずつ認識が行われるものの、高速処理によって数秒でのデータ出力を実現している。
3.インテリジェント単語認識
機械学習をとり入れた、「インテリジェント文字認識」とほぼ同じアルゴリズムのシステム。認識作業が1文字ずつではなく、単語のまとまりで行われる。
4.光学マーク認識
文字や単語ではなく、特定のロゴや記号などを中心に読み取るシステム。「OMR(Optical Mark Reader)」と呼ばれており、日本国内ではマークシート用の読み取りシステムとして広く知られている。
OCRのタイプは、手書きをする状況や内容に合わせて選ぶことが重要です。例えば、在庫管理のようにスピード感が求められる現場では、崩れた手書き文字が多いと考えられるため、機械学習をとり入れたシステムが望ましいでしょう。
デメリット2.重要書類では人による再チェックが欠かせない
AIによる機械学習をとり入れたシステムであっても、OCRの認識率は約96%とされています。つまり、100文字では4文字、1,000文字では40文字ほど誤認識があることになるため、現状では人による再チェックが欠かせません。
もし重要書類で金額の桁や数字を間違えると、深刻なトラブルを招くリスクがあります。業務効率は上がりますが、テキストデータ化を任せきりにできるシステムではないので、あくまで「OCRは人をサポートするもの」と考えておきましょう。
デメリット3.スキャナで物足りるケースもある
「領収書などをデータ化する」という観点では、スキャナも選択肢になります。OCRのようなテキストデータ化はできませんが、画像データとして保管することが目的の場合は、安価なスキャナでも十分に対処できるでしょう。
OCRの強みは書類をデータ化できる点ではなく、汎用性の高いテキストに換えられる点です。日付管理や金額の計算、番号の照合など、コンピュータ上でそのままテキストを活用できる部分に価値があります。
スキャナとの違いを理解できていないと、サービスの選び方や導入範囲を誤るリスクがあるので注意してください。
OCR(光学文字認識)を活用できるビジネスシーン
オフィス業務や倉庫管理、メールのやり取りなど、OCRは幅広いビジネスシーンで役立ちます。ただし、費用対効果を最大化するには、サービスで実現できることを理解した上で導入プランを立てることが必要です。
その参考として、ここからはOCRを活用できる代表的なビジネスシーンを紹介します。
注文表や発注表の作成
仕入れや外注の頻度が高い企業は、注文表・発注表を作成するプロセスにOCRを導入してみましょう。これらの書類をテキストデータ化しておけば、「いつどこに注文した」「何をどれくらいの金額で外注した」などのデータを簡単に集約できます。
特にお金に関するデータは、収集して分析するだけで価値があるので、仕入れなどが多い企業はぜひ検討してみてください。
伝票や領収書の処理
経理や会計も、OCRの導入メリットが発揮されやすい部門です。例えば、さまざまな部署から届く伝票をテキストデータ化すると、表計算ソフトなどを用いて一元管理できるため、1枚1枚をチェックする必要がありません。
また、経費を使った従業員がスマートフォンで領収書を撮影し、データ化してから社内に共有するような使い方もあります。
申込書の一元管理
消費者や取引先が記入する申込書にも、OCR導入の余地があります。申込書はフォーマットが決まっている場合が多いため、OCRサービスを利用すると個人情報や会社情報などをスムーズに一元管理できます。
これまで大量の顧客データを打ち込んでいた企業は、OCR導入によって業務効率が大きく改善されるかもしれません。
商品番号と現品票の照合作業
倉庫管理や在庫管理では、商品のラベルに記載されている番号と現品票を照合する作業があります。端から見るとシンプルな作業ですが、実はこの照合作業もOCRによって効率化されています。
分かりやすい例としては、ハンディターミナルを活用する方法が挙げられます。商品ラベルと現品票をテキストデータ化すると、それぞれの商品番号を簡単に照合できるため、入庫・出庫のズレにもいち早く気づけます。
OCR(光学文字認識)と併用されているデジタル技術
AIとIoTの組み合わせなど、現代では複数のデジタル技術を併用することで、さらに便利なシステムが生み出されています。OCRも例外ではなく、ほかのデジタル技術を活用したサービスがすでに登場しています。
OCR単体では難しいことも実現されているため、どのような例があるのかチェックしていきましょう。
機械学習で読み取り精度・文字認識率をアップさせた「AI OCR」
代表的なサービスとしては、人工知能とOCRを組み合わせた「AI OCR」があります。
AI OCRは、機械学習によって読み取り精度を高めている新しいOCRです。手書きの文字認識率も高く、誤認識をしてもその経験から筆跡パターンなどを学習するため、運用するほど精度が上がります。
ただし、AI OCRにも種類があるため、導入前にそれぞれの特性をつかんでおきましょう。
<AI OCRの主なタイプ>
1.汎用×定型フォーマット型
ユーザーが事前設定した定型フォーマットを読み取り、指定された情報のみを抽出するタイプです。手動による定義づけは必要ですが、情報の内容と場所をしっかりと指定すれば、さまざまなタイプの帳票に対応できます。
2.汎用×非定型フォーマット型
自動学習を活用することで、定義づけまでAIが行ってくれるタイプです。フォーマットを指定しなくても、AI自身が「何がどこに書かれているのか」を判断して情報を抽出します。ただし、学習をさせる時間やデータが必要になるため、導入直後は読み取り精度や認識率が低い傾向にあります。
3.業務特化×非定型フォーマット型
特定分野への導入を見据えて、すでにAIによる学習が完了されているタイプです。ユーザーによる定義づけや学習用のデータがなくても、さまざまな帳票を読み取ってくれます。
ビジネスへの導入と考えると、「業務特化×非定型フォーマット型」が望ましいと感じるかもしれません。ただし、このタイプはすでに学習が完了しているため、汎用性に乏しい欠点があります。対応できる帳票のフォーマットも少ないので、自社の事業環境に特化したサービスを見つけないと、大きな導入メリットは得られないでしょう。
ほかのタイプにも目を通した上で、自社に適したものを判断してください。
組み合わせ方によって可能性が広がる「OCR×RPA」
RPA(Robotic Process Automation)とは、これまで人が行ってきた高度な作業を代行してくれる技術です。簡単にいえば、人がこなしている仕事や日常生活を真似できるロボットなので、人材不足の解決策として期待されています。
では、OCRとRPAを組み合わせると何ができるのか、分かりやすい例を見ていきましょう。
<OCRとRPAの組み合わせで実現できること(例)>
・RPAが書類をスキャナにかけて、OCRがその内容を読み取る
・OCRが読み取った情報をもとに、RPAが表やグラフを作成する
・名刺からOCRが顧客情報を抽出し、RPAがダイレクトメールを送る
ほかにも、OCRが読み取った請求書情報をもとにRPAが処理をするなど、OCRとRPAの組み合わせには多くの可能性があります。最適な組み合わせ方が見つかったり、さらに相性の良いシステムが加わったりすれば、あらゆる業務を自動化できる時代が来るかもしれません。
OCR(光学文字認識)を超えるデータ単位での研究も進められている
OCRはあくまで文字単位での認識システムですが、光学機器メーカーとして有名な『リコー』は、データ単位での認識を目指した研究を進めています。
例えば、請求書に記載される合計金額は、数字の一つひとつに意味があるわけではありません。いずれかの数字を誤認識しただけで全く異なる金額になってしまうため、文字単位のシステムは精度を100%にしない限り導入範囲が限られます。
一方、データ単位での認識システムが構築されると、合計金額を一つのデータとして認識できるようになります。このような技術が確立されれば、データを扱うあらゆる業界の形が変わるかもしれません。
OCR(光学文字認識)は汎用性が高く、さまざまなビジネスを変える技術
OCRはすでに実用化されていますが、完成されたシステムではありません。AIやRPAをはじめ、ほかのデジタル技術との組み合わせによっては、この先も進化していく可能性があります。
種類にもよりますが、OCRは全体として汎用性が高いシステムです。さまざまな業務にとり入れられる可能性があるので、関連技術の進化や誕生も追いながら、自社に導入することを検討してみましょう。
【こんな記事も読まれています】
・国内製造業の再生を狙うINDUSTRIAL-Xが推進する[ESG×DX]時代の戦い方
・製造業における購買・調達業務とは?課題の解決方法も紹介
・サプライチェーン排出量はなぜ注目される?算定方法も含めて紹介