検索の得手不得手で、デジタルデバイドが拡大する
デジタル化したテキストデータが膨大になるに従い、多くの企業、団体では新たな悩みに直面し始めているのではないでしょうか。社内蓄積のデータや顧客サービスのデータがあまりにも膨大で、人手で情報を整理することはもはや困難になってきていると思われます。適切な文書を探すには、キーワード等で検索をかけるしか方法がなくなってきています。
しかしキーワード検索には大きな欠点があります。データ利用者が、適合するキーワードを思いつかないと、多くの時間をかけて何度も検索を試みる、あるいは思いつくキーワードだけで情報検索を済ませてしまうことになります。
企業、団体内のこうした時間のロス、適切な情報にたどり着けないロスは積み重なり、もはや無視でないレベルになってきています。そのため適切なキーワードを思いつく人だけがスピーディに仕事ができる現状をもたらし、デジタルデバイド(情報格差)の急拡大につながっています。
人手では処理不可能となった膨大なデジタルデータには、新しいテクノロジーをもって解決するしかありません。
VecTechは、AIによる「言語のベクトル化」という新しいテクノロジーで、情報のINDEXを自動生成します。
デジタル課題にはデジタルテクノロジーで対抗
この言語のベクトル化というAI技術が開発されたのは10年ほど前ですが、翻訳精度の向上、文の解釈など多くの分野で利用されており、今日も発展し続けています。
文の中にある特定の言葉が、他のどんな言葉と一緒に使われているか、その頻度や特徴的な使われ方を計算し、特定の語を数値に置き換えます。1語につき数値は大体数百個作られますが、AIではこれを数百次元の隠れ層と呼んでいます、数値は数学的手法で、向きを持ったベクトルに変換されます。ベクトルなので、これでどの語とどの語が近いのか、近さを計算できるようになります。
VecTechでは、この言語ベクトルの技術を使って、最初の1語を思いつくだけで、探しているデータに近い、あるいは適合した数十~100(指定可)の関連キーワードを探し出し表示します。この表示されたワードをタップすると情報検索が行える他、この語を見出し語としたINDEXページにリンクできます。たった1語から、数千、数万のキーワードの表示が可能になります。だれもが優れた情報検索者になることができ、作業効率の大幅な向上が期待されます。
サービスには以下の2つのタイプがあります。
1辞典や辞書等、情報に正確な見出し語がある場合は、見出し語のベクトル・インデックスが生成できます。その名の通り、AIが作る事典や辞書の新しいタイプの目次になります。
2テキストデータの見出しが文になっている、あるいは文書を特定できる見出しがない場合、文書中のキーワードを抽出し、出現頻度の高いキーワードを中心に、多数の関連キーワード・クラスターを生成します。表示したキーワードを既存の検索システムにかけると、目的とする文書に素早くたどり着けるようになります。
テクノロジー進化の影響で、世界は日々変化しています。あらゆるジャンルで特定のキーワードが象徴する新しい動向、例えばSDGs、AI等々が、続々と誕生しています。この周辺には関連するキーワードも無数に誕生します。
また医学、病気のニュースや論文、ITやネットワークに関する新しい動向、特許情報や判例情報、様々な論文。社内で蓄積される顧客情報のキーワード、ネットで話題になっているキーワード、ECサイトでは検索した商品の、関連した商品ジャンルへの誘導も大切になってきています。
キーワードは単なるワードではありません。その奥や周辺に膨大な情報が潜んでいます。 VecTechのAIによるINDEX生成サービスを、組織内での情報の理解力向上、あるいはユーザーへの高度な情報サービスにお役立てください。