Ko-BaKo/Jの仕様書

KoBaKo/Jでは、言語処理に関する以下の機構を提供いたします。

以下に、仕様書の「はじめに」、「特徴」を示します。


仕様書全体をご用意しております。

こちらから、仕様書をダウンロードすることができます(PDFファイル)。


はじめに

Ko-BaKo/Jは、Windowsの環境下で日本語の文書を分析・分類するために必要な機能を提供します。日本語文を解析した結果に利用者の要求する意味分類情報を付与する解析機構とその解析機構を利用するための周辺ソフト群から成ります。

これらの機能は関数レベルでも仕様を公開しており、以下に示す構成になっています。

関数群

支援ツール

サンプルプログラム

※システムを構築するための手引き書として、ここのサンプルプログラムには、そのソースプログラムとリンク環境も含まれています。

本システムの特徴

本システムの大きな特徴としては、解析結果を解析対象原文内に出現した単語表記で表現するだけでなく、各用語の意味情報も含めて構成したデータにまとめているところがあげられます。機械的に言語解析を行う際に参照される各用語の辞書内容には、その用語の意味分類情報の記述が必要となりますが、本システムではその解析システム用の意味分類情報だけでなく、解析結果を参照するシステムが必要とするそのシステム独自の意味情報を付与することができます。

解析結果から文書を検索するためのインデックスを構築するにしても、文中に出現した単語表記を利用したインデックスだけでなく、該当単語における上位の用語や該当単語を部品とした構成製品での検索などが行える機構を用意しております。

必要とされる立場に適した分野の用語に対してのみ、このような意味情報を記述していただくことで、必要とされる文書の分類や検索などが効率良く行うことができるようになります。

具体的な例を挙げると以下のような機構を構築することができます。

また、本システムは、上記の解析処理を行う機構をライブラリとしても提供しており、それらを使ったシステムが容易に作成できることから、「ことばよるユーザインタフェース」の研究や実験など VC++を用いたソフトウエアの教材としてもご利用いただけます。