NumType
: numeral type
Values: | Card | Dist | Frac | Mult | Ord | Range | Sets |
いくつかの言語 (特にスラヴ語で) は,数 (numerals) の複雑な体系を備える.例えば,チェコ語の学校文法では”numeral”という数についての主要な品詞があり,これは数えることに関してほとんど全てのものを包含し,いくつものサブタイプが存在する.また,これには,数 (_kolik / how many, tolik / so many, několik / some, a few_といった語) を指示する疑問詞 (interrogative), 関係詞 (relative), 不定の指示語 (indefinite and demonstrative words) も含まれ,PronTypeにおいて,これらは空でない値を持つだろう (英語では,これらの語は数量詞 (quantifier) と呼ばれ,限定詞 (determiners) の下位グループに属する).
統語論の観点からいえば,形容詞のようにふるまうnumtypeもあれば,副詞のようにふるまうものもある.それぞれ,u-pos/ADJとu-pos/ADVのようにタグ付けされる.このように,素性NumType
はさまざまな品詞に適用される:
- u-pos/NUM: 基数 (cardinal numerals)
- u-pos/DET: 数量詞 (quantifiers)
- u-pos/ADJ: 限定形容詞 (definite adjectival; e.g. 序数 (ordinal numerals))
- u-pos/ADV: 副詞的な数詞 (e.g. 序数詞,倍数詞)で,限定的なものと代名詞的なものの両方をもつ
Card
: 基数 (ordinal number) か,それに対応する疑問詞 / 関係詞 / 不定詞 / 指示語
いくつかの印欧語では,thousand, million や_billion_に相当する語は数詞か名詞どちらに属すかが明瞭でない.
例
- [en] one, two, three
- [cs] jeden, dva, tři “one, two, three”; kolik “how many”; několik “some”; tolik “so many”; mnoho “many”; málo “few”
- [cs] čtvero, patero, desatero (four, five, tenの特定の形式; これらは形態的,統語的,そして文体的にみてもデフォルト形式の_čtyři, pět, deset_とは区別される; チェコ語の文法では,これらは “generic numerals” と呼ばれ, 他のあまり見られないタイプも包含する; 普遍的なタイプの中でこれに最も近いのは
Card
である.)
Ord
: 序数 (ordinal number) か,それに対応する疑問詞 / 関係詞 / 不定詞 / 指示語
これは,形容詞か (いくつかの言語では) 副詞である.
例
- [en] first, second, third;
- [cs] adjectival: první “first”; druhý “second”, třetí “third”; kolikátý lit. how manieth “which rank”; několikátý “some rank”; tolikátý “this/that rank”
- [cs] adverbial: poprvé “for the first time”; podruhé “for the second time”; potřetí “for the third time”; pokolikáté “for which time”, poněkolikáté “for x-th time”, potolikáté
Mult
: multiplicative numeral or corresponding interrogative / relative / indefinite / demonstrative word
これは,形容詞か副詞のサブタイプである.
例
- [sl] dvojen “double, twofold”; trojen “triple, threefold”; četveren “fourfold”
- [cs] dvojí “twofold”; trojí “threefold” (multiplicative adjectives)
- [cs] jednou “once”; dvakrát “twice”; třikrát “three times”; kolikrát “how many times”, několikrát “several times”; tolikrát “so many times” (multiplicative adverbs)
Frac
: 分数 (fraction)
基数のサブタイプに属し,コーパスによっては設定されることがある.これは分数もしくは単に分母を表し,さまざまな言語で形態的,統語的に名詞もしくは序数詞としてふるまう.
例
- [en] three-quarters
- [cs] půl / polovina “half”; třetina “one third”; čtvrt / čtvrtina “quarter”
Sets
: 集合の数・集合数詞 (number of sets of things; collective numeral)
これは数詞の独立したクラスであり,事物の集合を数えるために用いられる数詞か,絶対複数 (pluralia tantum) を示す名詞である.研究者によってはこのタイプを集合数詞 (collective numeral) と呼ぶことがある.
例
- [cs] dvoje / troje boty “two / three [pairs of] shoes”; 通常の基数詞とは区別される: dvě / tři boty “two / three shoes”
Dist
: 配分される数 (distributive numeral)
同じ量が特定のターゲット内の各成員に配分されることを表す.
例
- [hu] három-három in gyermekenként három-három ezer forinttal “three thousand forint per child”
Range
: 数値の範囲
基数のサブタイプと考えられ,コーパスによっては設定されることがある.
例
- [en] two-five “two to five” (トークン化の際,全体を1つのトークンとして扱う.)
NumType in other languages: [u]