メインコンテンツへスキップ

インテリジェント文書認識サービス

人工知能を活用するAlfresco

膨大なビジネス情報の処理に追われる企業の多くは、全社規模でのコンテンツ管理、自動化の推進、そして事業を前進させるために必要なインサイトの抽出を可能にする方法を模索しています。そこでお勧めなのが、次のインテリジェント文書ソリューションです。Alfresco Intelligence Servicesは、Amazon TextractAmazon ComprehendAmazon Rekognitionのようなアマゾンウェブサービス(AWS)のAIや機械学習を活用して自動的にコンテンツを充実させ、実用的なインサイトを得るための拡張性に富んだ方法を提供します。これらのソリューションにより、貴重なインテリジェンスを自動的に抽出して、固有のビジネスニーズに対応し、情報に基づいた意思決定を迅速に行うことができます。

簡単に開始

  • AIやMLの経験がなくても、Alfresco Intelligence Servicesを稼働させるだけで、すぐにインテリジェント文書認識を始められます。
  • 複雑な設定はありません。シンプルなルールによって、Alfresco Intelligence Servicesで文書を処理すべきかどうかが制御されます。

ブースト機能

  • データを迅速かつ正確に抽出し、結果をファイルプロパティ(メタデータ)として取り込み、検索、プロセス、分析を向上させます。
  • AIが生成した情報を元の文書の追加レンディションとして保存できます。
  • 必要に応じて追加情報だけを簡単に抽出できるので、同じファイルを二度処理する必要がありません。

コストの削減

  • 人件費がかさむデータサイエンティストを雇う必要はありません。
  • コンテンツの取り込みを手動で行う必要がないため、処理にかかるコストを削減できます。
  • 文書やファイルが正確に分類されるため、情報の検索やアクセスにかかる時間と労力が削減されます。 

インテリジェンスサービスでデジタルトランスフォーメーションを加速

Alfrescoは、Alfresco Digital Business Platformにネイティブに統合されたAWSサービスを提供し、インテリジェント文書ソリューションで新規コンテンツや既存コンテンツを充実させることができます。

Amazon Comprehendを使用し、自然言語処理で文書からインサイトを抽出

Amazon Comprehendは、機械学習を使用して、機械学習の経験がなくてもテキスト内のインサイトや関係を見出す自然言語処理サービス(NLP)です。お客様メール、サポートチケット、製品レビュー、ソーシャルメディア、広告のコピーといった非構造化データから役立つデータを調べます。

  • 膨大なテキストの中から関心のある特定の項目を特定します(アナリストレポートでの会社名の検索など)。
  • 言語の中に隠された感情(否定的なレビュー、またはサービス担当者とお客様との肯定的なやり取り)を学習します。
  • 人、場所、製品、日付、イベント、組織、数量、物、言語、その他などのエンティティを分析します。
Amazon Textract

Amazon Textractは、スキャンした文書からテキストとデータを自動的に抽出するサービスです。Alfrescoのオープンアーキテクチャと組み合わせることで、Textractは大量に取り込んだデーを想像以上の速さで分類できるインテリジェントな情報処理機能を提供します。詳細については、このデモをご覧ください。 

 

Amazon Rekognitionを使って画像からテキストを抽出・分析

Amazon Rekognitionは、ディープラーニング(深層学習)技術とAWSの画像認識機能を使用して画像からテキストを抽出し、その情報を文書メタデータとしてAlfresco Content Servicesに保存します。Alfresco Intelligence Servicesでは、想像を遥かに超えた速さでインテリジェント文書認識ソフトウェアのメリットを活用し始めることができます。

  • 画像やビデオ内のオブジェクト、人物、テキスト、シーン、アクティビティを識別します。
  • 不適切なコンテンツを検出します。
  • 顔分析と検索機能を使用して顔を検出、分析、比較を行い、さまざまなユーザー検証、人数のカウント、公共の安全に関する使用例に対応します。

スキャンした文書からテキストとデータを抽出

Amazon Textractは、書類の記入欄の内容や表内の情報を特定することもできる、単なる光学式文字認識ソフトウェア(OCR)を超えた完全に管理された機械学習サービスです。Alfrescoのオープンアーキテクチャと組み合わせることで、Amazon Textractインテリジェント情報処理サービスは、これまで以上に迅速に情報の大量摂取からデータを分類することができます。

  • かつてない速さでスキャンした文書、印刷されたテキスト、手書きなどのデータを自動的に抽出します。
  • 文書のレイアウトや主要な要素、埋め込まれたフォームやテーブルのデータ関係を自動的に検出し、コンテキストを保持したまますべてを抽出します。
  • 情報を取得した後は、業務アプリケーション内でその情報に対してアクションを実行し、ローン申請、保険請求、登録フォーム、医療保険請求などを処理するための次のステップを開始できます。

AlfrescoのECM機能

Alfresco Content Servicesは、オープンで柔軟、かつ拡張性の高いエンタープライズコンテンツ管理(ECM)機能を備えています。働く場所に関係なく、どこからでもコンテンツにアクセスでき、他のビジネスアプリケーションにも簡単に統合できます。

 

インテリジェント文書認識サービスに関するFAQ(よく寄せられる質問)

アマゾンウェブサービスとは何ですか?

アマゾンウェブサービス(AWS)は、世界で最も普及している包括的なクラウドプラットフォームであり、世界各地のデータセンターからフル機能のサービスが165以上提供されています。急成長を遂げるスタートアップ企業、大手企業、主要行政機関など、数え切れないユーザーが組織のインフラストラクチャの強化、アジリティの改善、コストの削減にAWSを活用しています。

機械学習を使用してフォームやテーブルからデータを抽出する目的は何ですか?

今日、多くの企業が手動のデータ入力(時間がかかり、コストがかかり、エラーが発生しやすい)を介してPDF、表、フォームなどのスキャンされた文書からデータを抽出しています。またはフォームを使用可能にするために毎回更新を必要とする手動設定の単純なOCRソフトウェアを介してデータを抽出しています。Textractのようなサービスは、これらの手動プロセスを変えるために機械学習を使用して、あらゆる種類の文書を瞬時に読み取り、処理し、印刷されたテキスト、手書き、フォーム、表、およびその他のデータを手作業で操作したりカスタムコードを必要したりせずに正確に抽出します。

テキストの自動抽出にはどのような用途がありますか?

テキスト抽出で情報をキャプチャした後、その情報に対して業務アプリケーション内でアクションを起こすことができます。例えば、保険請求、顧客申請、市民対応、登録フォーム、医療請求処理、またはインテリジェント文書認識キャプチャを使用できるスキャンデータなどに対応する次のステップを開始します。