AI Service > OCR > 概要
OCRは、NHN Cloudの 光学文字認識(OCR)技術を利用して画像や文書の文字領域を認識し、領域ごとに文字を抽出する機能を提供します。認識した文書のDB化や、文書処理の自動化を実装する顧客社で活用できます。
General OCR
主な機能
- 画像の文字領域認識
- 画像の文字領域(bounding box)を認識し、その領域の座標を提供します。
- 信頼値の提供
- 画像から抽出したテキストの信頼値(confidence)を提供します。
- 分析結果のダウンロード
- 画像ファイルから抽出した結果をTextおよびJSONファイルでダウンロードできます。
入力画像ガイド
より正確な画像分析のために下記のガイドをご参考ください。
- ファイル/画像URL推奨事項
- ファイル形式:.jpeg、.png形式の画像分析機能をサポートします。
- 最大容量:ファイルコンテンツ5MB、画像URLコンテンツ20MB
- 推奨解像度:1280x720
- 長い画像を分析する場合、「分割認識機能」を使用すると、より正確な分析結果を得ることができます。
* 「縦-横」または「縦-横」のアスペクト比が1:2.5を超える長い画像は、分析性能低下の原因になることがあります。
* アスペクト比が1:2.5を超える画像で正確な認識が必要な場合は、「分割認識機能」を使用して分析結果の精度を高めることができます。
* 画像を分割して認識する場合、一部の重なり合った領域に重複したテキストが分析結果に含まれる場合があります。
* アスペクト比が約1:10を超える場合、分析ができません。
- 画像の推奨事項
- 平らな場所で、できるだけまっすぐに伸ばした状態で撮影された画像を使用してください。
- 正方形の完全な画像で認識してください。
- カメラフラッシュなどによる光の反射や影で文字がよく見えない場合や、解像度に対して文字サイズが小さい場合は、正確な文字抽出が難しい場合があります。
- 白黒、カラー画像の両方で結果分析が可能ですが、正確な分析のためにはカラー画像を推奨します。
- General OCRは韓国語と英語のみ分析結果を提供します。
Document OCR
事業者登録証の分析
主な機能
-
事業者登録証の文字領域認識
- 事業者登録証の文字領域(bounding box)を認識し、該当領域の座標を提供します。
-
事業者登録証の主要なデータの抽出および分析
- 事業者登録証の分類(個人/法人)に基づくデータはKey/Valueのペアで分析され、これの信頼値(Confidence)を提供します。
-
分析結果ダウンロード
- 事業者登録証ファイルから抽出した結果をExcelおよびJSONファイルでダウンロードできます。
入力画像ガイド
より正確な事業者登録証分析を行うために、以下のガイドを参照してください。
- ファイル推奨事項
- .pdf、.jpeg、.png形式の事業者登録証画像分析機能をサポートします。
- 最大容量:5MB
- 推奨解像度:1280 x 720以上
- PDFの場合、単一ページの分析結果のみ提供します。(複数のページの場合、最初のページの分析結果が提供されます。)
- 平らな場所で、できる限り伸ばした状態で撮影された画像を使用してください。
- 四角形の大きく映った画像で認識してください。
- カメラのフラッシュなどによる光の反射や影により文字がよく見えない場合、正確なKey/Value抽出が難しくなる場合があります。
- 白黒/カラー画像の結果分析が可能ですが、正確な分析を行うためにカラーの画像を推奨します。
- 事業者登録証は韓国語に限り分析結果を提供します。
クレジットカードの分析
主な機能
-
クレジットカード文字領域認識
- クレジットカード画像のカード番号、有効期限文字領域(bounding box)を認識し、該当領域の座標を提供します。
-
クレジットカードの主なデータの抽出と分析
- クレジットカード画像のカード番号、有効期限情報と、信頼値(confidence)を提供します。
-
分析結果のダウンロード
- クレジットカード画像ファイルから抽出した結果をJSONファイルでダウンロードできます。
入力画像ガイド
より正確なクレジットカード分析を行うために、以下のガイドを参照してください。
- ファイル推奨事項
- .jpeg、.png形式の事業者登録証画像分析機能をサポートします。
- 最大容量:5MB
- 推奨解像度:760 x 720以上
- 平らな場所で、できる限り伸ばした状態で撮影された画像を使用してください。
- 四角形の大きく映った画像で認識してください。
- カメラのフラッシュなどによる光の反射や影により文字がよく見えない場合、正確なKey/Value抽出が難しくなる場合があります。
- 白黒/カラー画像の結果分析が可能ですが、正確な分析を行うためにカラーの画像を推奨します。
- 縦方向のカードの場合、カードのカード番号と有効期限が正しい方向の画像で認識してください。
- クレジットカード分析画像例
身分証分析
主な機能
-
身分証文字領域認識
- 身分証の文字領域(bounding box)を認識し、当該領域の座標を提供します。
-
身分証の主要データの抽出および分析
- 身分証の種類(住民登録証/運転免許証/パスポート)に基づく主要データはKey/Valueのペアで分析され、信頼値(confidence)を提供します。
-
身分証の真偽確認
- 身分証画像ファイルから抽出した結果をもとに身分証の真偽を確認できます。
-
分析結果のダウンロード
- 身分証画像ファイルから抽出した結果をJSONファイルでダウンロードできます。
入力画像ガイド
身分証をより正確に分析するために以下のガイドを参考にしてください。
- ファイル推奨事項
- ファイル形式:.jpeg、.png形式の画像分析機能をサポートします。
- 最大容量:5MB
- 推奨解像度:760x480
- 画像推奨事項
- 平らな場所で、できる限り伸ばした状態で撮影された画像を使用してください。
- 四角形の大きく映った画像で認識してください。
- カメラのフラッシュなどによる光の反射や影で文字が見えづらい場合、正確なKey/Value抽出が難しくなる場合があります。
- 白黒/カラー画像の結果分析が可能ですが、正確な分析を行うためにカラーの画像を推奨します。
- 身分証(住民登録証/運転免許証)は韓国語に限り分析結果を提供します。
- 身分証(住民登録証/運転免許証/パスポート)は韓国語に限り分析結果を提供します。
- パスポートは国内、外国人パスポートの分析が可能で、外国人パスポートの場合、MRZ(機械読み取り領域)のみ分析結果を提供します。
Vehicle Plate OCR
主な機能
-
車両ナンバープレート文字領域認識
- 自動車の前面と背面に取り付けられている長方形の車のナンバープレートの文字領域(bounding box)を認識します。
-
車両ナンバープレート文字検出
- 認識した文字領域の文字を検出し、それに対する信頼値(confidence)を提供します。
-
分析結果のダウンロード
- 車両ナンバープレートファイルから抽出した結果をJSONファイルでダウンロードできます。
入力画像ガイド
正確なナンバープレート分析を行うために、以下のガイドを参照してください。
-
ファイル推奨事項
- ファイル形式:.jpe、.png形式の画像分析機能をサポートします。
- 最大容量:5MB
- 推奨解像度:1280 x 720以上
-
画像推奨事項
- 車両ナンバープレートが正面に見え、自動車のボンネットまで映っている画像を推奨します。
- 1つの画像内に1台の車両のみ撮影される環境を推奨します。
- 複数の車両ナンバープレートがある場合、1つの車両ナンバープレートについて分析結果を提供します。
- 一般的な車両ナンバープレート(特殊目的車両除く)について分析結果を提供します。
- カメラのフラッシュサービスなどによる光の反射がひどい場合、認識率が低下することがあります。
- 車両ナンバープレートが破損している場合や、異物が付着して正常な認識が難しい場合、認識率が低下することがあります。
- 車両ナンバープレートは韓国語に限り分析結果を提供します。
-
車両ナンバープレート分析画像例
サービス対象
- 文書(事業者登録証、クレジットカード、身分証)を自動的に顧客社のシステムに登録する場合
- 文書処理の自動化を実装する場合
- 会計/財務管理自動化ソリューションを構築する場合
- 車両の出入りを管理する駐車管理システムを構築する場合
- 車両通行監視システムを構築する場合
- 違法駐停車、過積車、違法車両ナンバープレートなどの交通取り締まりシステムを構築する場合
- 車両ナンバープレートのDB化が必要な場合
- 自動車の情報分析が必要な場合
個人情報処理についての案内
- OCRを利用する過程で、お客様は利用者の個人情報およびデリケートな情報を収集する場合があります。したがってこのサービスを利用するお客様は、個人情報保護法に基づいて利用者に法的告知事項を伝え、同意を得る必要があります。また、この過程でお客様とNHN Cloudの間に個人情報処理に関する業務委受託関係が発生する場合があります。委託者であるお客様は受託社NHN Cloudと別途書面による委託契約を締結する場合があり、下記の内容を参考にしてお客様が運営する個人情報処理方針に告知できます。
- 受託業者:NHN Cloud(株)
- 委託業務の内容:OCR提供業務
技術的/管理的水準についての合意書
- お客様は、OCRサービスを利用する過程で収集/利用する情報の機密性を考慮して技術的、管理的保護措置を忠実に履行する必要があります。
- お客様は、OCRサービスを通して認識された情報を伝受け取るために、OCRサービスの利用開始前に通信区間の暗号化を完了する必要があります。
- お客様は、OCRサービスに認識リクエストを行う原本データを安全な場所に保存しなければならず、外部表示可能なURLを介してアクセスできないようにする必要があります。
- お客様は、OCRサービスから安全な認識結果データを提供するために推奨する転送方式(専用回線、IPSecVPNなど)を採択する必要があります。
- お客様は、OCRサービスを通して認識された情報を保存/保管/管理する際、個人情報保護法などの関連法令を遵守する必要があります。
- 当社はお客様が上記で定めた技術的、管理的措置を全て備えているかの確認が必要な場合、お客様に証拠を要求することができます。
- 上記の事項はOCRサービスを通してお客様が収集/利用する情報が重要な情報に当たるためお客様に要求する事項です。
当社はお客様の要求に基づき受託社として委託された範囲内で情報を処理し、お客様は情報処理の主体として上記事項の履行を保証し、違反により発生する情報主体、規制機関などに対するすべての責任を負うことを確認します。