home edit page issue tracker

This page pertains to UD version 2.

Layered universal features

言語によっては,同一の語に対して複数の素性 (features) が標示される (marked) 場合があり,これを,素性の layers が存在するものと考える. 個々のレイヤー (layers) の正確な意味は,言語に依存する.

例えば,所有形容詞 (possessive adjectives) ,限定詞 (determiners) や代名詞 (pronouns) は u-feat/Gender で2つの異なる値 (values) を持ち, u-feat/Number でも2つの異なる値を持つことがある.値の1つは修飾された (所有された) 名詞 (noun) との一致 (agreement) によって決定される.これは,他の (所有を表さない) 形容詞や限定詞といった,性 (gender) と数 (number) に関して修飾した名詞と一致を起こさないものと並行的に考えることができる.他の値は語彙的に決定されるが,これは,所有者 (possessor) 自身の性質である. 以下の表では,次のことを示している;英語では所有者の性と数のみを区別する;ヒンディー語は性の一致を区別し,数は一致と所有者の両方から区別される (ヒンディー語には中性 (neuter) が存在しない);ドイツ語では,性と数のどちらも,一致と所有者の両方から区別される (ドイツ語において,主格 (nominative) だけではなく与格 (dative) や対格 (accusative) 形をみたとき,変化はより鮮明となる).

Possessor / Agreement   Sing Masc Sing Fem Sing Neut Plur Masc Plur Fem
Sing Masc [en]
[de]
[hi]
his son
sein Sohn
usakā bēṭā
his daughter
seine Tochter
usakī bēṭī
his house
sein Haus
 
his sons
seine Söhne
usakē bēṭē
his daughters
seine Töchter
usakī bēṭiyām̐
Sing Fem [en]
[de]
[hi]
her son
ihr Sohn
usakā bēṭā
her daughter
ihre Tochter
usakī bēṭī
her house
ihr Haus
 
her sons
ihre Söhne
usakē bēṭē
her daughters
ihre Töchter
usakī bēṭiyām̐
Sing Neut [en]
[de]
 
its son
sein Sohn
 
its daughter
seine Tochter
 
its house
sein Haus
 
its sons
seine Söhne
 
its daughters
seine Töchter
 
Plur [en]
[de]
[hi]
their son
ihr Sohn
unakā bēṭā
their daughter
ihre Tochter
unakī bēṭī
their house
ihr Haus
 
their sons
ihre Söhne
unakē bēṭē
their daughters
ihre Töchter
unakī bēṭiyām̐

ある言語で素性がレイヤーを成すとき,素性の名前はレイヤーを示す必要がある.また,レイヤーを区別するため,例えば所有者の性を Gender[psor] のようにして,大括弧 [ ] に表される識別子が用いられる. レイヤーの識別子は,小文字の英字 [a-z] か,もしくは [0-9] から構成することが推奨される.レイヤー,レイヤーの意味や識別子は,本ドキュメンテーションで用いられる言語固有の拡張子 (language-specific extension) によって定義されなければならない.各レイヤーにある素性に関して,1つのレイヤーはデフォルトとして定義されることがあり,その場合は,例えば Gender=Masc|Gender[psor]=Fem のように,対応する素性が識別子なしで現れることになる.

以下,実際のコーパスで確認されたレイヤーの素性の例を列挙しておく. また,ツリーバンクが本セクションで示したレイヤーの素性を用いたとしても,特定言語のドキュメンテーションにおいては,レイヤーが何なのかを説明することが望ましい.

Gender[psor]

所有形容詞や代名詞は2つの異なる を持つことがある: 1つは所有物 (被修飾名詞との性の一致) であり,もう1つは所有者 (語彙的素性,固有の性) である.

素性 Gender[psor] は所有者の性を表す.

以下のチェコ語の例では,男性 (masuline) の Gender[psor] が 接尾辞 -ův, -ova, -ovo, をいずれかを用いることを示しており,女性 (feminine) の Gender[psor] が -in, -ina, -ino のいずれかを用いることを示している.

Masc: masculine possessor

例: [cs] otcův syn (father’s son; Gender=Masc|Gender[psor]=Masc); otcova dcera (father’s daughter; Gender=Fem|Gender[psor]=Masc); otcovo dítě (father’s child; Gender=Neut|Gender[psor]=Masc).

Fem: feminine possessor

例: [cs] matčin syn (mother’s son; Gender=Masc|Gender[psor]=Fem); matčina dcera (mother’s daughter; Gender=Fem|Gender[psor]=Fem); matčino dítě (mother’s child; Gender=Neut|Gender[psor]=Fem).

他の言語 (ヘブライ語,アラビア語) では,所有者の性と数は語彙自体の素性よりも,一致によって決定される.

例: [he] HKPH FL HARC (国の周囲 (perimeter of country) ). 2つの名詞の素性は以下の通り: perimeter.Gender=Masc|Gender[psor]=Fem|Number=Sing|Number[psor]=Sing country.Definite=Def|Gender=Fem|Number=Sing.

perimeter の素性 [psor] は,所有者である country. との一致から決定される.

(これは,上記の例の部分的な記述である.HKPH は多数の形態論的分析が行われ,男性・単数のレイヤーと,女性・単数のレイヤーに分かれる.2つの一致素性のレイヤーを見つけて個々の一致パターンに同定できれば,正しい形態分析が可能となる.)

Number[psor]

所有形は2つの異なった を持つことがある: 1つは所有物 (被修飾名詞との数の一致) であり,もう1つは所有者である. 素性 Number[psor] は所有者の数を表す.

Sing: singular possessor

例: [en] my, his, her, its; [cs] můj pes (my dog; Number=Sing|Number[psor]=Sing); psi (my dogs; Number=Plur|Number[psor]=Sing).

Plur: plural possessor

例: [en] our, their; [cs] náš pes (our dog; Number=Sing|Number[psor]=Plur); naši psi (our dogs; Number=Plur|Number[psor]=Plur).

Person[psor]

所有者の人称 (person) はハンガリー語の名詞などには標示される.これらの名詞形は,所有代名詞 + 名詞 として英語に翻訳されるだろう.

これは、デフォルトの 人称 が通常,名詞に標示されないとしても,レイヤー素性と考えることが合理的だろう.名詞は,動詞との関係 (名詞と人称の一致を行う場合がある) により,常に3人称として現れる.よって,デフォルトの人称が表層で形態的に標示されず,デフォルトの Person が名詞の素性に現れなかったとしても,所有者を標示するためにデフォルトのレイヤーを用いるべきではない.デフォルトのレイヤーを濫用することで,名詞が置き換わる人称代名詞と並行的にタグ付けを扱えなくなるからである.

一方で,所有形の限定詞/代名詞の人称に対して独立した [psor] のレイヤーを設けることは行わないだろう. それらは動詞ではなく名詞を修飾し,おそらく Person を一つしか持たず,その素性は語彙的なものであろう (ハンガリー語の名詞では,Person[psor] は屈折する (inflectional) であるが) . また,通常それらは動詞ではなく名詞を修飾するため,動詞との一致は役割をもたない.さらに,いくつかの言語では,所有代名詞が人称代名詞の属格 (genitive) case と同一であり,これらは当然,主格 (nominative) においても同じ Person を持っている.

1: first person possessor

例: [hu] kutya = dog; kutyám = my dog; kutyánk = our dog.

2: second person possessor

例: [hu] kutya = dog; kutyád = your.Sing dog; kutyátok = your.Plur dog.

3: third person possessor

例: [hu] kutya = dog; kutyája = his/her/its dog; kutyájuk = their dog.

János csontja
lit. John his-bone
John’s bone

János csontjai
lit. John his-bones
John’s bones

Péternek sok pénze van.
lit. to-Peter much his-money there-is
Peter has a lot of money.

Number[psee]

この素性はハンガリー語に特有であり,所有物の (所有された名詞句の) 数を示す.ハンガリー語は名詞の屈折に関して3タイプの数がある.:

Multext-East にあるハンガリー語のレキシコンからの例:

ただし,複数の所有 (plural possession) が標示された語は極めて稀である.以下はMultext-Eastからの例であるが,Columbusにある標示は所有者を表すのではなく,複数の所有を表していることに注意されたい.

詳しくは Éva Dékány (2014): The syntax of anaphoric possessives in Hungarian を参照されたい:

In anaphoric possessives the possessed noun, the head of the whole nominal phrase, is not pronounced, and its reference has to be recovered from the context. The possessor in Hungarian anaphoric possessives has to bear the suffix.

Since Number[psee]=Plur is extremely rare, this feature is not so important for distinguishing singular and plural possessions. However, the mere presence of Number[psee]=Sing informs that there is the suffix and thus that there is an unpronounced possession.

Layered verb agreement in Basque

印欧語 (Indo-European languages) の多くの言語では,動詞は主語 (subject) の人称と数に一致しなければらない.これは,動詞の u-feat/Personu-feat/Number によって示される.

バスク語 (Basque) のいくつかの動詞では,最大3つの項 (arguments) の数と人称に一致する必要がある: 絶対格 (absolutive) の項 (自動詞の主語,他動詞の目的語),能格 (ergative) の項 (他動詞の主語),与格 (dative) の項 (間接目的語).

絶対格の一致をデフォルトとして扱い,Person and Number を識別子なしに用いることが可能である.そのとき,他の2つの項のいずれかがある場合は Person[erg]Number[erg]Person[dat]Number[dat] をそれぞれ用いる. 

Example: nahi dizkiegu, lemma = nahi_izan, feats = Number=Plur|Number[dat]=Plur|Number[erg]=Plur|Person=3|Person[dat]=3|Person[erg]=1 (we want them to them).