Ko-BaKo/Jの機能

Ko-BaKo/Jは、次の機能や、すぐにお使いいただけるようサンプルプログラムを提供いたします。

文切り機能

txtを始めとして、doc,xls,ppt,htmlなど幅広い形式に対応した、文切りツールです。

ファイル内にある文章を、形態素解析などの処理の入力形式である、1行1文形式にして、txtファイルに出力します。

形態素解析機能

品詞・細品詞や意味属性を付与します。

品詞・細品詞

品詞名(POS) 細品詞(SPOS) 単語例
名詞 普通名詞 パソコン、森、
副詞的名詞
特殊名詞 国際
代名詞 代名詞 私、これ
数詞 基数 1,三
序数
動詞 五段 読(む)、書(く)
一段
する
くる
愛す・愛する
信じる・信ずる
熱す・熱する
判定詞
形容詞 形容詞 美し(い)、厳し(い)
サ変 動詞用法 輸出、交換、
名詞用法
連続用法
形容動詞 ’に’をとる きれい(だ)、立派(だ)
’な’をとる
’の’をとる
名詞用法
連続用法
副詞 通常の副詞 ずっと、ようやく
連体詞 限定連体詞 この、いわゆる
形容連体詞 堂々たる
接続詞 文頭接続詞 したがって
文中接続詞 および
感動詞 感動詞
句点
読点
記号 その他の記号
形式名詞 こと、もの こと
単位 前置単位
後置単位
助数詞 前置助数詞 期、ヶ月
単位に後置
数、単位に後置
接頭辞 接頭辞
接尾辞 接尾辞
サ変語尾 する する、し
形容動詞語尾
である である
です です
動詞語尾 使役語尾
五段語尾 う、く、す
一段語尾
形容詞語尾 形容詞語尾 い、く
助詞 助詞 は、が
助動詞 助動詞

意味属性

AKO
+- 具体
|  +- 主体
|  |  +- 人
|  |  +- 組織
|  +- 具体的場所
|  |  +- 地域
|  |  +- 自然
|  |  |  +- 地勢
|  |  |  +- 天文
|  |  +- 人工的場所
|  +- 具体物
|     +- 自然物
|     |  +- 生物
|     |  |  +- 動物
|     |  |  +- 動物の一種または派生物
|     |  |  +- 植物
|     |  |  +- 植物の一種または派生物
|     |  +- 物質
|     |     +- 固体
|     |     +- 液体
|     |     +- 気体
|     +- 人工物
|        +- 製品
|        +- 半製品
|        +- 人工物の一部または派生物
+- 抽象
   +- 抽象事
   |  +- 活動
   |  |  +- 行為
   |  |  +- 精神活動
   |  |     +- 理性的活動
   |  |     +- 感情的活動
   |  +- 現象
   |  |  +- 事象
   |  |  +- 自然現象
   |  |  +- 社会現象
   |  |  +- 生理現象
   +- 抽象物
   |  +- 活動の産物
   |     +- 行為の結果
   |     +- 精神活動の結果
   |     +- 社会的に定着した抽象物;風俗、習慣を含む
   |     +- 文化として定着した抽象物
   |     +- 非物理的人工物
   +- 抽象的関係
      +- 抽象的場所
      +- 時間
      +- 存在
      +- 集合
      +- 属性名
      |  +- 性質
      |  +- 状態
      |  +- 外観
      |  +- 類・型
      |  +- 数量
      |  +- 関係
      |  +- 機能
      +- 属性値
         +- 性質
         +- 状態
         +- 外観
         +- 類・型
         +- 数量
         +- 関係
         +- 機能
  

構文解析機能

文節の係り受け構造と格関係を付与します。

構文解析結果

構文解析の結果は以下のような構成で成り立っています。

開始フラグ<Janalysis>
ファイル名<filename>入力ファイル名を、パスとともに出力します。
文番号<sentence_id>ファイル内にあった文に対して、IDを1からシーケンシャルに振ります。
<text>対象文。
形態素情報<m_info>形態素情報を記述します。
構文情報<s_info>構文情報を記述します。
構文構造<struct_com>構文解析した結果を構文構造として、表示します。

漢字・カナ(ローマ字)変換機能

読みは、仮名と、ローマ字の両方でつきます。

例文東京に19時につく。
仮名とうきょう に 19じ に つく。
ローマ字toukyou ni 19ji ni tsuku.

辞書データベース追加・修正機能

簡単にユーザ辞書を作成したり、辞書内容に変更を加えることが出来ます。

ある特定の分野の語彙を集中的に増やしたり、既存の辞書のシソーラス体系を修正し、オリジナルの体系を作ることも可能です。

サンプルプログラム

すぐにKo-BaKo/Jの機能を使用できるプログラムを提供いたします。

具体的な説明については、仕様書のPDF「第4章 ツール」をご覧ください。

文書解析ツール

文に形態素情報・構文情報を付与します。

読み仮名変換ツール

1文1行形式の原文ファイルを指定すると、そのファイル内の各文に読みを付与します。

文切りツール

テキスト、Word、Excel、PowerPoint、HTMLファイルからテキスト部分を取り出し、1文1行形式に整えます。

辞書登録ツール

ユーザ辞書に単語を追加します。単語単位登録機能と一括登録機能があります。

検索・抽出ツール

解析結果のファイルをからユーザが指定した条件を検索し抽出するツールです。