『梵天』の概要
『梵天』の公開は 2021/12/24 に終了いたしました
『国語研日本語ウェブコーパス』(NWJC)検索系「梵天」の特徴としては以下の点が挙げられます。
3種類の検索方法
『梵天』では、「文字列検索」「品詞列検索」「係り受け検索」の 3 種類の検索方法を提供しています。
文字列検索
単位の切れ目を気にせずに文字列を検索できる。あくまでも「出現した表記」の検索なので「こくご」を調べると「国語」はヒットしない。
品詞列検索
品詞列の情報を条件式として指定し、その条件にマッチする語を検索できる。例えば接尾辞「ぽい」が出てきた例を調べたい場合、語彙素「ぽい」で検索すると表層形「ぽい」「っぽい」「っぽく」「っぽ」がヒットする。
係り受け検索
品詞列の情報に加え、係り受け関係の情報を条件式として指定し、その条件にマッチする文節を検索できる。例えば「私は」が動詞に係る例を調べたい場合、文節「私+は」(→係り先→)文節「品詞:動詞-一般」で検索すると、「私は」が動詞に係っている文がヒットする。
検索結果の表示
検索結果に表示される「キー」は検索語がマッチした < 文節 >がキーとなります。
ドメイン指定検索
検索する際にドメイン(ac.jp など末尾2パート)を指定して検索することができます。
検索結果のダウンロード
検索結果を係り受け解析器「CaboCha」の出力形式(CaboCha形式, -f1 オプション)またはタブ区切りテキスト形式(TSV形式)でダウンロードすることができます。