home issue tracker

This page pertains to UD version 2.

Universal POS tags

These tags mark the core part-of-speech categories. To distinguish additional lexical and grammatical properties of words, use the universal features.

Open class words Closed class words Other
ADJ ADP PUNCT
ADV AUX SYM
INTJ CCONJ X
NOUN DET  
PROPN NUM  
VERB PART  
  PRON  
  SCONJ  

ADJ: adjective

Definition

形容詞は.典型的に名詞を修飾し,その特性や属性を指定するような語を指す:

The oldest French bridge

形容詞は述語機能を果たすこともある::

The car is green.

ADJタグは通常の形容詞のみを意図している.限定詞に関しては DET を,(基数) 数に関しては NUM を参照したい.ADJEuropeanといった“真正な形容詞”に対してのみ用いられる.

数 対 形容詞: 一般的に,基数は品詞 NUM をとる一方,序数 (ordinal numbers) (より正確には,_形容詞的_序数) はADJタグをとる.

数詞 (numeral) と伝統的に呼ばれる語はいくつかの言語 (e.g., チェコ語) にみられるが,UDのタグ付けスキーマでは形容詞として扱う.特に,_形容詞的_序数 (注意: チェコ語は副詞的なものを備えている) は,形態的にも統語的にも形容詞として振る舞うため,ADJとタグ付けされる.

名詞 対 形容詞: 別の名詞に修飾することで複合名詞 (compound noun) を形成するような名詞は,ADJ ではなく NOUN タグが与えられる.

分詞: 分詞 (participles) は,その特性や用法を形容詞,名詞および動詞と共有するような語形を指す.言語やコンテクストによって,分詞はADJNOUN もしくは VERB として分類される.

形容詞を修飾する形容詞: 一般的に,ADJADV (very strong) によって修飾される.しかし,場合によってはADJを修飾する語がADJとしてみなされることがある.これらのケースは 次のものを含む: (i) 最上級の形容詞を修飾する序数 (the third oldest bridge) (ii) 2つの形容詞が複合形容詞を形成するとき (an African American mayor).

Examples

References

edit ADJ

ADP: adposition

Definition

側置詞 (adposition) は前置詞 (prepositions) と後置詞 (postpositions) のカバータームである.側置詞は,名詞句,名詞,代名詞もしくは名詞句として機能する節に前に生起する項目 (前置詞) および後に生起する項目 (後置詞) から成る閉じた集合 (closed set) である.また,側置詞と補部から成る単一の構造により,節内にある他のユニットとの文法的・意味的な関係が表現される.

多くの言語では,側置詞は_in spite of_, because of_および_thanks to_よいった固定した複合表現の形式を取ることができる.それらの要素は通常の使用に則したタグ付け (_in is ADP, spite is NOUN, etc.) がなされ,複合表現としてのステータスは統語タグによって説明される.

ゲルマン語では前置詞が_give in_ や _hold on_のように,動詞の不変化詞 (verbal particles) として機能することもあるので注意されたい.また,不変化詞は PART ではなくADPとしてタグ付けされる.

Examples

References

edit ADP

ADV: adverb

Definition

副詞 (adverbs) は verb を典型的に修飾し,時間,場所,方向や様態といったカテゴリを表す語を指す.副詞は adjectives や_very brieflyarguably wrong_といった他の副詞を修飾する.直接命名するのではなく,コンテクストにおける状況を指示する_代名詞的副詞_の下位クラスが存在する; 代名詞に類似しており,これらは疑問詞,関係詞,指示詞などとして分類される.代名詞的副詞はADVの品詞タグを持つが,追加の素性によって区別される.

ゲルマン語では,いくつかの副詞は,write down or _end up_のように動詞の不変化詞として機能することがある.それらは PART ではなく,ADVとしてタグ付けされる.

いくつかの言語 (e.g., チェコ語) では序数 (numerals) と伝統的に呼ばれる語が存在するが,UDのタグ付けスキームでは副詞として扱う.特に,副詞的序数([cs] poprvé “for the first time”) と_倍数_ (e.g. once, twice) は統語的に副詞として振る舞い,ADVとしてタグ付けされる.

また,副動詞 (transgressives) もしくは _副詞的分詞_と呼ばれる動詞の語形が存在し,副詞と動詞の性質および用法を共有している.これらは言語やコンテクストによって,VERBADVとして分類されるだろう.

Examples

References

edit ADV

AUX: auxiliary

Definition

助動詞 (auxiliary) は動詞句における動詞に付随し,動詞自体が区別しない人称,数,時制,ムード,アスペクト,ヴォイスやエビデンシャリティーといった情報を表す.多くの場合で助動詞は動詞 (助動詞でない用法もある) であるが,多数の言語では非動詞的なTAMEマーカー を取り,AUXとしてタグ付けされることがある.AUXのクラスはコピュラ動詞 (動詞でない述語に用いられる,狭義の連結語) も含む

法動詞 (modal verbs) は,いくつかの言語 (英語など) では助動詞として数えられる.言語によっては法動詞の振る舞いが main verbs と大差がないため,VERBとしてタグ付けされる.

ただし,全ての言語で文法化した助動詞を持つわけではなく,助動詞が存在したとしても,完全な動詞と助動詞との境界線は言語によって変化することに注意されたい.どの語がAUXとして数えられるかは,言語特有のドキュメンテーションによって説明されるだろう.

Examples

References

edit AUX

CCONJ: coordinating conjunction

Definition

等位接続詞 (coordinating conjunction) は,語や語より大きな構成素を連結するような語を指し,一方が他方へ統語的に従属させることなく両者の意味関係を表現する.

従属接続詞 (subordinating conjunctions) に関しては,SCONJ を参照.

Examples

References

edit CCONJ

DET: determiner

Definition

限定詞 (determiners) は nouns や名詞句を修飾するような語を指し,コンテクスト上で名詞句の指示対象を表す.つまり,限定詞が示しているのは,当該の名詞が表す対象が定か不定か,近くにあるのか遠くにあるのか,特定の人物や物なのか,もしくは特定の数や数量なのか,といったことである.

この定義のもと,限定詞は,冠詞 (articles) と_代名詞的形容詞 (pronominal adjectives)_ と呼ばれる,ふだん英語で限定詞としてみなされるものよりも広いものを含む.特に,名詞句を修飾できるのは一つの限定詞に限られる,といった条件は存在しないが,言語によってはこのような制約に対する強い傾向を示す.(例えば,英語の名詞句は普段一つだけの修飾語DETのみを許すが,時には_追加の限定詞 (addeterminers)_ と呼ばれるものが通常の限定詞の外に生起する場合がある.追加の限定詞には,[en] all in all the children survived といったものがあり,_all_と_the_は両方ともPOSタグにおいてDETと表記される.)

DETタグは (代名詞的な) 数量詞 (quantifiers) ( many, few, several_のような語) を含み,限定詞とみなす言語もあれば,数詞としてみなす言語もあることに注意したい.しかし,狭義の_基数詞 (cardinal numeral; e.g. one, five, hundred) は,これを数量詞に含める人もいるが,DETは与えられない.基数は独自のタグ NUM を持つからである.

さらに,限定詞の概念は伝統文法では不明な言語もある (e.g. チェコ語); これらの言語では,英語の限定詞に相当する語が pronouns および/もしくは numerals として分類される.同じ対象をどの言語でも同じようにタグ付けするには,限定詞の上記の定義を満たす語は,チェコ語のような言語でもDETとしてタグ付けするのが望ましい.

代名詞と限定詞の境目が常に明瞭だとは限らない.UD v1とは異なり,これらの語の区別はコンテクストのみに基づくわけではなく,_典型的な_統語分布 (適用可能なら形態論的なものも) に基づき,辞書によってPRONもしくはDETの分類が予め決定されることもある.言語特有のドキュメンテーションでは (閉じたクラスである) 全ての限定詞をリスト化し,可能ならば曖昧な点を挙げるべきである.

限定詞の決定に関するヒントとしては,general principles on pronominal words も参照されたい. 詳しい情報:

Examples

References

edit DET

INTJ: interjection

Definition

間投詞 (interjection) とは,感嘆 (exclamation) や,その一部を成すものとして用いられる語を指す.間投詞は典型的に感情的な反応を表し,他の表現と統語的な関係を結ばず,他の言語にはないような音の組み合わせも含んでいる.

第一義として他の品詞に属している間投詞は,感嘆で使用されたとしても元々の品詞カテゴリを保持することに注意されたい.例えば,_God_は感嘆であっても NOUN である.

間投詞の特殊例として,yes, no, uhuh といった応答の不変化詞 (feedback particles) もある.

Examples

References

edit INTJ

NOUN: noun

定義

名詞 (nouns) は,典型的には人物,場所,物,動物や思想を示すような品詞を指す.

NOUNタグは普通名詞 (common nouns) のみを意図しており,固有名詞 (proper nouns) については PROPN,代名詞 (pronouns) は PRON を参照されたい.

動名詞 (gerunds) や不定詞 (infinitives) は名詞と動詞の用法を共有していることに注意したい.これらは,言語やコンテクストによって VERBNOUNとして分類される.

参考文献

edit NOUN

NUM: numeral

Definition

数詞 (numeral) とは,限定詞,形容詞や代名詞として典型的に機能し,数字や,数に関係する量,順序,頻度もしくは比などを表すような語を指す.

基数詞 (cardinal numerals) は,限定詞として用いられるか (Windows Seven_のように),単語の(four), 桁数の(4)_ もしくはローマ数字_(IV)_で表記されるかに関わらずNUMとして扱われる.限定詞として機能する他の語 (_many_や_few_など) にはDETがタグ付けされる.

いくつかの言語 (e.g., チェコ語) では序数 (numerals) と伝統的に呼ばれる語が存在するが,NUMとしてタグ付けをしない.序数のような,基数でない数詞はUDのタグ付けスキームにおいて他の品詞に属し,その基準は主に統語的なものである: 通常の序数は adjectives (first, second, third) または adverbs ([cs] poprvé “for the first time”) である.倍数 (multiplicative numerals) は副詞で,(once, twice) がその例である.

Examples

References

edit NUM

PART: particle

Definition

不変化詞 (particles) とは,他の語や句と連結することで意味を与え,他の品詞 (e.g. adpositions, coordinating conjunctions, subordinating conjunctions もしくはauxiliary verbs) の定義を満たさないような機能語を指す.不変化詞は否定,ムード,時制といった文法カテゴリをエンコードすることがあり,例外はあるものの,通常は屈折しない.

PARTタグは,ゲルマン諸語における,give in_や_end up_といった_小辞 (verbal particles) と呼ばれるものを包括することができない. これらは元々側置詞や副詞であるため,ADPADV としてタグ付けされる.ゲルマン諸語における分離可能な動詞接頭辞 (separable verb prefixes) の扱いは類推から与えられる.

日本語において伝統的に助詞と呼ばれる機能語の全てが自動的にPARTタグの資格を持つわけではない.PARTとして扱うものには,例えば疑問助詞 か/ka があり,他の助詞 (e.g. に/ni,の/no) は他言語における側置詞 (adpostion) と並行的であるため,ADP としてタグ付けされる.

一般的に,PARTタグの適用は限定すべきで,他のタグが適用できない場合に限り用いるべきである.言語特有のドキュメンテーションでは,PARTとして分類される語をリストしておくことが望ましい.

Examples

References

edit PART

PRON: pronoun

Definition

代名詞 (pronouns) とは,nouns もしくは名詞句を置き換える語を指し,その意味は言語的または言語外のコンテクストから復元可能である.

この定義のもとでは,代名詞は名詞のように機能する.いくつかの言語では,_代名詞_という用語を拡張し,adjectives と置き換えるようにしてあることに注意したい.そのような語は,UDのタグ付けスキームではPRONとタグ付けされず,言語間で同じ手法を採るべく determiners のタグを付与する.

代名詞と限定詞の境目が常に明瞭だとは限らない.UD v1とは異なり,これらの語の区別はコンテクストのみに基づくわけではなく,_典型的な_統語分布 (適用可能なら形態論的なものも) に基づき,辞書によってPRONもしくはDETの分類が予め決定されることもある.言語特有のドキュメンテーションでは (閉じたクラスである) 全ての限定詞をリスト化し,可能ならば曖昧な点を挙げておくべきである.

限定詞の決定に関するヒントとしては,general principles on pronominal words も参照されたい 詳しい情報:

Examples

References

edit PRON

PROPN: proper noun

Definition

固有名詞 (proper noun) とは,特定の人物,場所,物体に対して名称を与える名詞を指す.

PROPNが使用できるのは,名称として用いられ,特殊な統語的性質 (英語において,冠詞を伴わずに単数形が生起する) をみせるような名詞の下位クラスに限定される.他の句や文が名称として用いられるとき,構成要素の語は元々のタグを保持する.例えば,_Cat on a Hot Tin Roof_では_Cat_はNOUN, _on_がADP, _a_がDET,など.

この手法を採る利点は,語源的に形容詞や分詞である語が_the Yellow Pages_, _United Airlines_や_Thrall Manufacturing Company_のように,表現全体が固有名詞として機能する複合表現の部分であるとき,これらの語を固有名としてみなすことが珍しくないことにある.これは,英語のPennツリーバンクのタグセットの慣習に基づく.

UN_や_NATO_といった頭文字語 (acronym) の固有名詞は,PROPNとしてタグ付けされる.数字 (製品名など) を含む場合であっても,SYM ではなくPROPNとしてタグ付けされる: _130XE, DC10, DC-10. しかし,トークン全体が桁数から構成される (_Windows 7_の_7_のように) 場合,NUM とタグ付けされる.

Examples

References

edit PROPN

PUNCT: punctuation

Definition

句読点 (punctuations) はアルファベットでない文字で,印刷物にある言語ユニットを限定するのに用いられる文字のグループを指す.

句読点は_$%§_といった記号を含めず,これらは代わりに SYM としてタグ付けされる.(ヒント: _dollar_や_percent_のように,発音したものに相当する語である場合,PUNCTではなくSYMとしてタグ付けされる.)

話し言葉コーパスにはポーズを表す記号があり,笑い声や他の音が含まれる; これらは同様に句読点として扱われるが,トークンの文字が全てアルファベット以外である必要は必ずしもない.

Examples

References

edit PUNCT

SCONJ: subordinating conjunction

Definition

従属接続詞 (subordinating conjunction) は,一つの構造を他方の構造の構成素にすることで構造を結合する接続詞を指す.従属接続詞は,編入した構成素 (incorporated constituent) を典型的に標示し,これは (従属) 節のステータスを持つ.

以下3つの下位クラスは従属接続詞としてみなされ,これは Loos et al. 2003 に準拠している:

等位接続詞 (coordinating conjunctions) については,CCONJ を参照されたい..

Examples

References

edit SCONJ

SYM: symbol

Definition

シンボル (symbol) は語のようなものを指し,形式や機能が通常の語とは異なる.

シンボルの多くは,punctuation のようなアルファベット・数字ではない特殊文字を含む.句読点とシンボルの違いは,通常の語と置き換え可能か否にある.通貨のシンボル (e.g. $ 75) は,_seventy-five dollars_と同一である.

数学の演算子は他のシンボルとは異なるグループを形成する.

他のシンボルのグループには顔文字 (emoticons) や絵文字 (emoji) がある

アルファベット・数字のみから成る文字列はシンボルではなく,proper nouns である: 130XE, DC10; 他の場合は,特殊文字を文字を含んでいても (SYMではなく) PROPNとしてタグ付けされる: DC-10. 同様に,略語 (abbreviations) はシンボルではなく,完全な形式の品詞として分析される.例えば,Mr. (mister), kg (kilogram), km (kilometer) や_Dr_ (Doctor) は nouns としてタグ付けされる._UN_や_NATO_のように頭文字語 (acronym) で表される固有名は proper nouns としてタグ付けされる.

箇条書きに用いられる記号 (•, ‣) はシンボルではなく,句読点である.

Examples

edit SYM

VERB: verb

Definition

動詞 (verb) は典型的事象や行為を表す統語クラスの成員を指し,節内で最小の述語を構成することが可能で,節に生起する他の構成素における数 (number) やタイプを支配 (govern) する.動詞は時制,ムード,アスペクトやヴォイスといった文法カテゴリに関連することが多く,それらは動詞の屈折や助動詞または分詞によって表現される.

VERBタグは主に本動詞_(内容動詞)をカバーし,_助動詞_や (狭義の) _コピュラ動詞AUX タグで表示される.法動詞VERBAUXだと考えられ,当該言語の振る舞いによって判断される.言語特融のドキュメンテーションでは,どのコンテクストで,どの動詞がAUXとタグ付けされるかを指定しておくのが良い.

分詞 (particle) とは,形容詞と動詞の性質・用法を共有する語形を指し,言語とコンテクストによってVERBADJ のどちらかにタグ付けされる.

動名詞 (gerunds) や_不定詞 (infinitives)_ といった語形も形容詞と動詞の性質・用法を共有し.言語とコンテクストによってVERBNOUN のどちらかにタグ付けされる.

副動詞 (transgressives) や_副詞的分詞 (adverbial participles)_ とは,副詞と動詞の性質・用法を共有する動詞の形式を指し,言語やコンテクストによってVERBもしくは ADV のどちらかに分類される.

Examples

References

edit VERB

X: other

定義

Xタグは何らかの理由で実際の品詞カテゴリに属さないような語を指し,限定的な使用に留めるべきである.

Xの特殊な用法にはコード切り替え (code-switching) がある.コード切り替えにおいて,切り替わった言語が文法的に分析できない (分析が有意義でない) ことがある (または,依存関係 flat:foreign が統語分析に用いられることがある). 通常の借用語 (loan words) に対してはこの用法は適用できず,通常の品詞に割り当てるべきである.例えば,_he put on a large sombrero_における_sombrero_は通常の NOUN である.

edit X