Universal POS tags
These tags mark the core part-of-speech categories. To distinguish additional lexical and grammatical properties of words, use the universal features.
Open class words | Closed class words | Other |
---|---|---|
ADJ | ADP | PUNCT |
ADV | AUX | SYM |
INTJ | CCONJ | X |
NOUN | DET | |
PROPN | NUM | |
VERB | PART | |
PRON | ||
SCONJ |
ADJ
: adjective
Definition
形容詞は.典型的に名詞を修飾し,その特性や属性を指定するような語を指す:
The oldest French bridge
形容詞は述語機能を果たすこともある::
The car is green.
ADJ
タグは通常の形容詞のみを意図している.限定詞に関しては DET を,(基数) 数に関しては NUM を参照したい.ADJ
はEuropeanといった“真正な形容詞”に対してのみ用いられる.
数 対 形容詞: 一般的に,基数は品詞 NUM をとる一方,序数 (ordinal numbers) (より正確には,_形容詞的_序数) はADJ
タグをとる.
数詞 (numeral) と伝統的に呼ばれる語はいくつかの言語 (e.g., チェコ語) にみられるが,UDのタグ付けスキーマでは形容詞として扱う.特に,_形容詞的_序数 (注意: チェコ語は副詞的なものを備えている) は,形態的にも統語的にも形容詞として振る舞うため,ADJ
とタグ付けされる.
名詞 対 形容詞: 別の名詞に修飾することで複合名詞 (compound noun) を形成するような名詞は,ADJ
ではなく NOUN タグが与えられる.
分詞: 分詞 (participles) は,その特性や用法を形容詞,名詞および動詞と共有するような語形を指す.言語やコンテクストによって,分詞はADJ
,NOUN もしくは VERB として分類される.
形容詞を修飾する形容詞: 一般的に,ADJ
は ADV (very strong) によって修飾される.しかし,場合によってはADJ
を修飾する語がADJ
としてみなされることがある.これらのケースは
次のものを含む: (i) 最上級の形容詞を修飾する序数 (the third oldest bridge) (ii) 2つの形容詞が複合形容詞を形成するとき (an African American mayor).
Examples
- big
- old
- green
- African
- incomprehensible
- first, second, third
References
ADP
: adposition
Definition
側置詞 (adposition) は前置詞 (prepositions) と後置詞 (postpositions) のカバータームである.側置詞は,名詞句,名詞,代名詞もしくは名詞句として機能する節に前に生起する項目 (前置詞) および後に生起する項目 (後置詞) から成る閉じた集合 (closed set) である.また,側置詞と補部から成る単一の構造により,節内にある他のユニットとの文法的・意味的な関係が表現される.
多くの言語では,側置詞は_in spite of_, because of_および_thanks to_よいった固定した複合表現の形式を取ることができる.それらの要素は通常の使用に則したタグ付け (_in is ADP
, spite is NOUN, etc.) がなされ,複合表現としてのステータスは統語タグによって説明される.
ゲルマン語では前置詞が_give in_ や _hold on_のように,動詞の不変化詞 (verbal particles) として機能することもあるので注意されたい.また,不変化詞は PART ではなくADP
としてタグ付けされる.
Examples
- in
- to
- during
References
ADV
: adverb
Definition
副詞 (adverbs) は verb を典型的に修飾し,時間,場所,方向や様態といったカテゴリを表す語を指す.副詞は adjectives や_very briefly,arguably wrong_といった他の副詞を修飾する.直接命名するのではなく,コンテクストにおける状況を指示する_代名詞的副詞_の下位クラスが存在する; 代名詞に類似しており,これらは疑問詞,関係詞,指示詞などとして分類される.代名詞的副詞はADV
の品詞タグを持つが,追加の素性によって区別される.
ゲルマン語では,いくつかの副詞は,write down or _end up_のように動詞の不変化詞として機能することがある.それらは PART ではなく,ADV
としてタグ付けされる.
いくつかの言語 (e.g., チェコ語) では序数 (numerals) と伝統的に呼ばれる語が存在するが,UDのタグ付けスキームでは副詞として扱う.特に,副詞的序数([cs] poprvé “for the first time”) と_倍数_ (e.g. once, twice) は統語的に副詞として振る舞い,ADV
としてタグ付けされる.
また,副動詞 (transgressives) もしくは _副詞的分詞_と呼ばれる動詞の語形が存在し,副詞と動詞の性質および用法を共有している.これらは言語やコンテクストによって,VERB やADV
として分類されるだろう.
Examples
- very
- well
- exactly
- tomorrow
- up, down
- 疑問副詞: where, when, how, why
- 指示的副詞: here, there, now, then
- 不定副詞: somewhere, sometime, anywhere, anytime
-
: everywhere, always
- 否定副詞: nowhere, never
References
AUX
: auxiliary
Definition
助動詞 (auxiliary) は動詞句における動詞に付随し,動詞自体が区別しない人称,数,時制,ムード,アスペクト,ヴォイスやエビデンシャリティーといった情報を表す.多くの場合で助動詞は動詞 (助動詞でない用法もある) であるが,多数の言語では非動詞的なTAMEマーカー を取り,AUX
としてタグ付けされることがある.AUX
のクラスはコピュラ動詞 (動詞でない述語に用いられる,狭義の連結語) も含む
法動詞 (modal verbs) は,いくつかの言語 (英語など) では助動詞として数えられる.言語によっては法動詞の振る舞いが main verbs と大差がないため,VERB
としてタグ付けされる.
ただし,全ての言語で文法化した助動詞を持つわけではなく,助動詞が存在したとしても,完全な動詞と助動詞との境界線は言語によって変化することに注意されたい.どの語がAUX
として数えられるかは,言語特有のドキュメンテーションによって説明されるだろう.
Examples
- 時制助動詞 (tense auxiliaries): has (done), is (doing), will (do)
- 受動態の助動詞 (Passive auxiliaries): was (done), got (done)
- 法助動詞 (Modal auxiliaries): should (do), must (do)
- コピュラ動詞 (Verbal copulas): He is a teacher.
References
CCONJ
: coordinating conjunction
Definition
等位接続詞 (coordinating conjunction) は,語や語より大きな構成素を連結するような語を指し,一方が他方へ統語的に従属させることなく両者の意味関係を表現する.
従属接続詞 (subordinating conjunctions) に関しては,SCONJ を参照.
Examples
- and
- or
- but
References
- Loos, Eugene E., et al. 2003. Glossary of linguistic terms: What is a coordinating conjunction?
- Wikipedia
DET
: determiner
Definition
限定詞 (determiners) は nouns や名詞句を修飾するような語を指し,コンテクスト上で名詞句の指示対象を表す.つまり,限定詞が示しているのは,当該の名詞が表す対象が定か不定か,近くにあるのか遠くにあるのか,特定の人物や物なのか,もしくは特定の数や数量なのか,といったことである.
この定義のもと,限定詞は,冠詞 (articles) と_代名詞的形容詞 (pronominal adjectives)_ と呼ばれる,ふだん英語で限定詞としてみなされるものよりも広いものを含む.特に,名詞句を修飾できるのは一つの限定詞に限られる,といった条件は存在しないが,言語によってはこのような制約に対する強い傾向を示す.(例えば,英語の名詞句は普段一つだけの修飾語DET
のみを許すが,時には_追加の限定詞 (addeterminers)_ と呼ばれるものが通常の限定詞の外に生起する場合がある.追加の限定詞には,[en] all in all the children survived といったものがあり,_all_と_the_は両方ともPOSタグにおいてDET
と表記される.)
DET
タグは (代名詞的な) 数量詞 (quantifiers) ( many, few, several_のような語) を含み,限定詞とみなす言語もあれば,数詞としてみなす言語もあることに注意したい.しかし,狭義の_基数詞 (cardinal numeral; e.g. one, five, hundred) は,これを数量詞に含める人もいるが,DET
は与えられない.基数は独自のタグ NUM を持つからである.
さらに,限定詞の概念は伝統文法では不明な言語もある (e.g. チェコ語); これらの言語では,英語の限定詞に相当する語が pronouns および/もしくは numerals として分類される.同じ対象をどの言語でも同じようにタグ付けするには,限定詞の上記の定義を満たす語は,チェコ語のような言語でもDET
としてタグ付けするのが望ましい.
代名詞と限定詞の境目が常に明瞭だとは限らない.UD v1とは異なり,これらの語の区別はコンテクストのみに基づくわけではなく,_典型的な_統語分布 (適用可能なら形態論的なものも) に基づき,辞書によってPRON
もしくはDET
の分類が予め決定されることもある.言語特有のドキュメンテーションでは (閉じたクラスである) 全ての限定詞をリスト化し,可能ならば曖昧な点を挙げるべきである.
限定詞の決定に関するヒントとしては,general principles on pronominal words も参照されたい. 詳しい情報:
- 冠詞 (the, a, an) は常に
DET
としてタグ付けされる; それらの PronType はArt
である. - 代名詞的数詞 (数量詞) は
DET
としてタグ付けされる;PronType
に加えて, 数量詞には素性 NumType を用いる. - 形容詞のように振る舞う語は
DET
である. 類似した振る舞い:- 名詞句として用いられる (名詞句と置換できる) よりも,限定修飾として用いられる (名詞句を修飾する) ことの方が多い.ただし,単独で生起することもあり,これは,省略 (ellipsis) や,_All [visitors] must pay._のように,想定できる被修飾名詞が指定されないか一般的なものを表していることに起因する.
- 屈折 (inflection) は (適用可能であるなら),名詞ではなく形容詞に類似している.修飾する名詞と一致 (agree) し,特に,性 (gender) に関して屈折する特性は形容詞や限定詞で典型的である.(名詞の性は語彙的に決定される.限定詞では,文法から名詞との性の一致が要請される; よって,限定詞は性に関して屈折する必要がある.)
- 所有表現 (possessives) は言語で異なる.言語によっては,上記のテストによって所有表現が
DET
カテゴリに入ることがある.すなわち,所有表現は特定の格 (属格 (genitive) が多い) をとる人称代名詞や,側置詞 (adposition) を伴う人称代名詞に類似する; よって,PRON
とタグ付けされる.
Examples
- 冠詞 (閉じたクラスで,定性 (definiteness) や特定性 (specificity) もしくは情報の新旧 (giveness) を示すようなもの): a, an, the
- 所有限定詞 (名詞句を修飾する): [cs] můj, tvůj, jeho, její, náš, váš, jejich; [en] my, your
- 指示限定詞 (demonstrative determiners): I saw this car yesterday. の_this_
- 疑問限定詞 (interrogative determiners): “Which car do you like?”_の_which
- 関係限定詞 (relative determiners): “I wonder which car you like.”_の_which
- 数量限定詞 (quantity determiners; 数量詞): 不定の_any_, 普遍量化子: all, “We have no cars available.”_の_no
References
INTJ
: interjection
Definition
間投詞 (interjection) とは,感嘆 (exclamation) や,その一部を成すものとして用いられる語を指す.間投詞は典型的に感情的な反応を表し,他の表現と統語的な関係を結ばず,他の言語にはないような音の組み合わせも含んでいる.
第一義として他の品詞に属している間投詞は,感嘆で使用されたとしても元々の品詞カテゴリを保持することに注意されたい.例えば,_God_は感嘆であっても NOUN である.
間投詞の特殊例として,yes, no, uhuh といった応答の不変化詞 (feedback particles) もある.
Examples
- psst
- ouch
- bravo
- hello
References
NOUN
: noun
定義
名詞 (nouns) は,典型的には人物,場所,物,動物や思想を示すような品詞を指す.
NOUN
タグは普通名詞 (common nouns) のみを意図しており,固有名詞 (proper nouns) については PROPN,代名詞 (pronouns) は PRON を参照されたい.
動名詞 (gerunds) や不定詞 (infinitives) は名詞と動詞の用法を共有していることに注意したい.これらは,言語やコンテクストによって VERB かNOUN
として分類される.
例
- girl
- cat
- tree
- air
- beauty
参考文献
NUM
: numeral
Definition
数詞 (numeral) とは,限定詞,形容詞や代名詞として典型的に機能し,数字や,数に関係する量,順序,頻度もしくは比などを表すような語を指す.
基数詞 (cardinal numerals) は,限定詞として用いられるか (Windows Seven_のように),単語の(four), 桁数の(4)_ もしくはローマ数字_(IV)_で表記されるかに関わらずNUM
として扱われる.限定詞として機能する他の語 (_many_や_few_など) にはDETがタグ付けされる.
いくつかの言語 (e.g., チェコ語) では序数 (numerals) と伝統的に呼ばれる語が存在するが,NUM
としてタグ付けをしない.序数のような,基数でない数詞はUDのタグ付けスキームにおいて他の品詞に属し,その基準は主に統語的なものである: 通常の序数は adjectives (first, second, third) または adverbs ([cs] poprvé “for the first time”) である.倍数 (multiplicative numerals) は副詞で,(once, twice) がその例である.
Examples
- 0, 1, 2, 3, 4, 5, 2014, 1000000, 3.14159265359
- one, two, three, seventy-seven
- I, II, III, IV, V, MMXIV
References
PART
: particle
Definition
不変化詞 (particles) とは,他の語や句と連結することで意味を与え,他の品詞 (e.g. adpositions, coordinating conjunctions, subordinating conjunctions もしくはauxiliary verbs) の定義を満たさないような機能語を指す.不変化詞は否定,ムード,時制といった文法カテゴリをエンコードすることがあり,例外はあるものの,通常は屈折しない.
PART
タグは,ゲルマン諸語における,give in_や_end up_といった_小辞 (verbal particles) と呼ばれるものを包括することができない.
これらは元々側置詞や副詞であるため,ADP や ADV としてタグ付けされる.ゲルマン諸語における分離可能な動詞接頭辞 (separable verb prefixes) の扱いは類推から与えられる.
日本語において伝統的に助詞と呼ばれる機能語の全てが自動的にPART
タグの資格を持つわけではない.PART
として扱うものには,例えば疑問助詞 か/ka があり,他の助詞 (e.g. に/ni,の/no) は他言語における側置詞 (adpostion) と並行的であるため,ADP としてタグ付けされる.
一般的に,PART
タグの適用は限定すべきで,他のタグが適用できない場合に限り用いるべきである.言語特有のドキュメンテーションでは,PART
として分類される語をリストしておくことが望ましい.
Examples
- 所有マーカー (possessive marker): [en] ‘s
- 否定辞 (negation particle): [en] not; [de] nicht
- 疑問助詞 (question particle): [ja] か / ka (adding this particle to the end of a clause turns the clause into a question); [tr] mu
- 文のモダリティ (sentence modality): [cs] ať, kéž, nechť (Let’s do it! If only I could do it over. May you have an enjoyable stay!)
References
PRON
: pronoun
Definition
代名詞 (pronouns) とは,nouns もしくは名詞句を置き換える語を指し,その意味は言語的または言語外のコンテクストから復元可能である.
この定義のもとでは,代名詞は名詞のように機能する.いくつかの言語では,_代名詞_という用語を拡張し,adjectives と置き換えるようにしてあることに注意したい.そのような語は,UDのタグ付けスキームではPRON
とタグ付けされず,言語間で同じ手法を採るべく determiners のタグを付与する.
代名詞と限定詞の境目が常に明瞭だとは限らない.UD v1とは異なり,これらの語の区別はコンテクストのみに基づくわけではなく,_典型的な_統語分布 (適用可能なら形態論的なものも) に基づき,辞書によってPRON
もしくはDET
の分類が予め決定されることもある.言語特有のドキュメンテーションでは (閉じたクラスである) 全ての限定詞をリスト化し,可能ならば曖昧な点を挙げておくべきである.
限定詞の決定に関するヒントとしては,general principles on pronominal words も参照されたい 詳しい情報:
- 所有格でない人称代名詞 (non-possessive personal),再帰代名詞 (reflexive),相互代名詞 (reciprocal), は必ず
PRON
とタグ付けされる. - 所有表現は言語で異なり,上記のテストによって所有表現が
DET
カテゴリに入る言語もある.すなわち,所有表現は特定の格 (属格 (genitive) が多い) をとる人称代名詞や,側置詞 (adposition) を伴う人称代名詞と類似する; よって,PRON
とタグ付けされる
Examples
- 人称代名詞 (personal pronouns): I, you, he, she, it, we, they
- 再帰代名詞 (reflexive pronouns): myself, yourself, himself, herself, itself, ourselves, yourselves, theirselves
- 疑問代名詞 (interrogative pronouns): who, what as in What do you think?
- 関係代名詞 (relative pronouns): who, what as in I wonder what you think. ([en]_that_のような,関係節を導入する語は従属接続詞 (文献によっては“補文標識 (complimentizers)“と呼ばれる) として分析した方が適切な場合があり,それらは SCONJ としてタグ付けされる.)
- 不定代名詞 (indefinite pronouns): somebody, something, anybody, anything
- 総称代名詞 (total pronouns): everybody, everything
- 否定代名詞 (negative pronouns): nobody, nothing
- 所有代名詞 (possessive pronouns; 名詞句として単独で生起する): mine, yours, (his), hers, (its), ours, theirs
References
PROPN
: proper noun
Definition
固有名詞 (proper noun) とは,特定の人物,場所,物体に対して名称を与える名詞を指す.
PROPN
が使用できるのは,名称として用いられ,特殊な統語的性質 (英語において,冠詞を伴わずに単数形が生起する) をみせるような名詞の下位クラスに限定される.他の句や文が名称として用いられるとき,構成要素の語は元々のタグを保持する.例えば,_Cat on a Hot Tin Roof_では_Cat_はNOUN, _on_がADP, _a_がDET,など.
この手法を採る利点は,語源的に形容詞や分詞である語が_the Yellow Pages_, _United Airlines_や_Thrall Manufacturing Company_のように,表現全体が固有名詞として機能する複合表現の部分であるとき,これらの語を固有名としてみなすことが珍しくないことにある.これは,英語のPennツリーバンクのタグセットの慣習に基づく.
UN_や_NATO_といった頭文字語 (acronym) の固有名詞は,PROPN
としてタグ付けされる.数字 (製品名など) を含む場合であっても,SYM ではなくPROPN
としてタグ付けされる: _130XE, DC10, DC-10.
しかし,トークン全体が桁数から構成される (_Windows 7_の_7_のように) 場合,NUM とタグ付けされる.
Examples
- Mary, John
- London
- NATO, HBO
References
PUNCT
: punctuation
Definition
句読点 (punctuations) はアルファベットでない文字で,印刷物にある言語ユニットを限定するのに用いられる文字のグループを指す.
句読点は_$,%や§_といった記号を含めず,これらは代わりに SYM としてタグ付けされる.(ヒント: _dollar_や_percent_のように,発音したものに相当する語である場合,PUNCT
ではなくSYM
としてタグ付けされる.)
話し言葉コーパスにはポーズを表す記号があり,笑い声や他の音が含まれる; これらは同様に句読点として扱われるが,トークンの文字が全てアルファベット以外である必要は必ずしもない.
Examples
- ピリオド (period): .
- カンマ (comma): ,
- 括弧 (parentheses): ()
References
SCONJ
: subordinating conjunction
Definition
従属接続詞 (subordinating conjunction) は,一つの構造を他方の構造の構成素にすることで構造を結合する接続詞を指す.従属接続詞は,編入した構成素 (incorporated constituent) を典型的に標示し,これは (従属) 節のステータスを持つ.
以下3つの下位クラスは従属接続詞としてみなされ,これは Loos et al. 2003 に準拠している:
- 補文標識 (complementizers) で,[en] _that_や_if_のようなもの
- 節を導入する副詞 (adverbial clause introducers) で,[en] when, since, や_before_のようなもの (名詞句ではなく,節を導入するもの)
- 関係詞 (relativizers) で,[he] še のようなもの (これらの語は単に関係節を導入するもので,通常は屈折しない.そして,関係詞は関係代名詞や再述代名詞 (resumptive pronouns) との区別が必要で,関係節内で名詞句のように機能し,PRON として分析する.)
等位接続詞 (coordinating conjunctions) については,CCONJ を参照されたい..
Examples
- I believe that he will come._の_that
- if
- while
References
- Loos, Eugene E., et al. 2003. Glossary of linguistic terms: What is a subordinating conjunction?
- Wikipedia
SYM
: symbol
Definition
シンボル (symbol) は語のようなものを指し,形式や機能が通常の語とは異なる.
シンボルの多くは,punctuation のようなアルファベット・数字ではない特殊文字を含む.句読点とシンボルの違いは,通常の語と置き換え可能か否にある.通貨のシンボル (e.g. $ 75) は,_seventy-five dollars_と同一である.
数学の演算子は他のシンボルとは異なるグループを形成する.
他のシンボルのグループには顔文字 (emoticons) や絵文字 (emoji) がある
アルファベット・数字のみから成る文字列はシンボルではなく,proper nouns である: 130XE, DC10; 他の場合は,特殊文字を文字を含んでいても (SYM
ではなく) PROPN
としてタグ付けされる: DC-10.
同様に,略語 (abbreviations) はシンボルではなく,完全な形式の品詞として分析される.例えば,Mr. (mister), kg (kilogram), km (kilometer) や_Dr_ (Doctor) は nouns としてタグ付けされる._UN_や_NATO_のように頭文字語 (acronym) で表される固有名は proper nouns としてタグ付けされる.
箇条書きに用いられる記号 (•, ‣) はシンボルではなく,句読点である.
Examples
- $, %, §, ©
- +, −, ×, ÷, =, <, >
- :), ♥‿♥, 😝
- john.doe@universal.org, http://universaldependencies.org/, 1-800-COMPANY
VERB
: verb
Definition
動詞 (verb) は典型的事象や行為を表す統語クラスの成員を指し,節内で最小の述語を構成することが可能で,節に生起する他の構成素における数 (number) やタイプを支配 (govern) する.動詞は時制,ムード,アスペクトやヴォイスといった文法カテゴリに関連することが多く,それらは動詞の屈折や助動詞または分詞によって表現される.
VERB
タグは主に本動詞_(内容動詞)をカバーし,_助動詞_や (狭義の) _コピュラ動詞 は AUX タグで表示される.法動詞 はVERB
かAUX
だと考えられ,当該言語の振る舞いによって判断される.言語特融のドキュメンテーションでは,どのコンテクストで,どの動詞がAUX
とタグ付けされるかを指定しておくのが良い.
分詞 (particle) とは,形容詞と動詞の性質・用法を共有する語形を指し,言語とコンテクストによってVERB
か ADJ のどちらかにタグ付けされる.
動名詞 (gerunds) や_不定詞 (infinitives)_ といった語形も形容詞と動詞の性質・用法を共有し.言語とコンテクストによってVERB
か NOUN のどちらかにタグ付けされる.
副動詞 (transgressives) や_副詞的分詞 (adverbial participles)_ とは,副詞と動詞の性質・用法を共有する動詞の形式を指し,言語やコンテクストによってVERB
もしくは ADV のどちらかに分類される.
Examples
- run, eat
- runs, ate
- running, eating
References
X
: other
定義
X
タグは何らかの理由で実際の品詞カテゴリに属さないような語を指し,限定的な使用に留めるべきである.
X
の特殊な用法にはコード切り替え (code-switching) がある.コード切り替えにおいて,切り替わった言語が文法的に分析できない (分析が有意義でない) ことがある (または,依存関係 flat:foreign が統語分析に用いられることがある).
通常の借用語 (loan words) に対してはこの用法は適用できず,通常の品詞に割り当てるべきである.例えば,_he put on a large sombrero_における_sombrero_は通常の NOUN である.
例
- And then he just xfgh pdl jklw