仕様書

KoBaKo/Jでは、言語処理に関する以下の機構を提供します。

ダウンロード

以下から仕様書をダウンロードできます。

仕様書(PDFファイル)

はじめに

Ko-BaKo/Jは、Windowsの環境下で日本語の文書を分析・分類するために必要な機能を提供します。日本語文を解析した結果に利用者の要求する意味分類情報を付与する解析機構とその解析機構を利用するための周辺ソフト群から成ります。

これらの機能は関数レベルでも仕様を公開しており、以下に示す構成になっています。

支援ツール
  • 動作環境の初期設定ツール
  • 辞書エディタ(対話型)
  • 辞書内容更新ツール(一括処理、バッチ型)
  • サンプルプログラム
  • 日本語解析ツール I(ファイルインタフェース)

本システムの特徴

本システムの大きな特徴としては、解析結果を解析対象原文内に出現した単語表記で表現するだけでなく、各用語の意味情報も含めて構成したデータにまとめているところがあげられます。機械的に言語解析を行う際に参照される各用語の辞書内容には、その用語の意味分類情報の記述が必要となりますが、本システムではその解析システム用の意味分類情報だけでなく、解析結果を参照するシステムが必要とするそのシステム独自の意味情報を付与することができます。

解析結果から文書を検索するためのインデックスを構築するにしても、文中に出現した単語表記を利用したインデックスだけでなく、該当単語における上位の用語や該当単語を部品とした構成製品での検索などが行える機構を用意しております。

必要とされる立場に適した分野の用語に対してのみ、このような意味情報を記述していただくことで、必要とされる文書の分類や検索などが効率良く行うことができるようになります。

具体的な例を挙げると以下のような機構を構築することができます。

  • 場所と地域との関係での知識獲得や分類や検索が可能例えば京都のお寺や神社などの名前を洛中、洛北、洛南、洛東、洛西というような地域名の一部として登録しておくことで、地域名で関連するお寺や神社などの固有名詞の出現する記事や案内を検索することができます。
  • お問い合わせ対応取り扱っている商品名や製品型番などをその分野名を上位として登録しておくことで、各商品名を示した情報検索・抽出ではなく、分野名によって情報を検索・抽出しておくことができます。
  • 個人名と組織名との関係での知識獲得や分類や検索が可能メンバー名の登録において、その所属するグループ名を上位として登録することで、該当メンバーに関する文書をグループ名によって検索・抽出しておくことができます。

また、本システムは、上記の解析処理を行う機構をライブラリとしても提供しており、それらを使ったシステムが容易に作成できることから、「ことばよるユーザインタフェース」の研究や実験など VC++を用いたソフトウエアの教材としてもご利用いただけます。