『梵天』の概要

『梵天』の公開は 2021/12/24 に終了いたしました

『国語研日本語ウェブコーパス』(NWJC)検索系「梵天」の特徴としては以下の点が挙げられます。

3種類の検索方法

『梵天』では、「文字列検索」「品詞列検索」「係り受け検索」の 3 種類の検索方法を提供しています。

文字列検索

単位の切れ目を気にせずに文字列を検索できる。あくまでも「出現した表記」の検索なので「こくご」を調べると「国語」はヒットしない。

品詞列検索

品詞列の情報を条件式として指定し、その条件にマッチする語を検索できる。例えば接尾辞「ぽい」が出てきた例を調べたい場合、語彙素「ぽい」で検索すると表層形「ぽい」「っぽい」「っぽく」「っぽ」がヒットする。

係り受け検索

品詞列の情報に加え、係り受け関係の情報を条件式として指定し、その条件にマッチする文節を検索できる。例えば「私は」が動詞に係る例を調べたい場合、文節「私+は」(→係り先→)文節「品詞:動詞-一般」で検索すると、「私は」が動詞に係っている文がヒットする。

検索結果の表示

検索結果に表示される「キー」は検索語がマッチした < 文節 >がキーとなります。

ドメイン指定検索

検索する際にドメイン(ac.jp など末尾2パート)を指定して検索することができます。

検索結果のダウンロード

検索結果を係り受け解析器「CaboCha」の出力形式(CaboCha形式, -f1 オプション)またはタブ区切りテキスト形式(TSV形式)でダウンロードすることができます。