Universal Dependencies
以下の表は,UD v2. で用いられる37つの普遍的な構文関係 (universal syntactic relations) をリスト化したものであり,これは Universal Stanford Dependencies: A cross-linguistic typology (de Marneffe et al. 2014) の改変版である.
表の上部はUDの分類法における主な構成原則に従う:
- 各列は主辞 (head) に対する機能カテゴリ (functional categories) と対応する:
- 節の述語 (clausal predicates) における必須項 (core argument)
- 節の述語における依存部 (non-core dependents)
- 名詞の依存部 (dependents of nominals)
- 各行は依存部の構造的カテゴリ (structural) に対応する:
- 名詞 (Nominals)
- 節 (Clauses)
- 修飾語 (Modifier words)
- 機能語 (Function words)
表の下部は狭義の依存関係 (dependency relations) にない関係をリスト化したものである:
- 等位関係 (coordination) の分析に用いられる関係
- 複合表現 (multiword expressions; MWE) の分析に用いられる関係
- 緩い結合関係 (Loose joining relations)
- 省略 (ellipsis),言い淀み (disfluencies),つづりの間違い (orthographic erros) を表す特別な関係
- 節の主辞,句読点などを表す特別な関係
|
|
|
|
|
|||||||||||||
|
|
|
|||||||||||||||
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|||||||||||||
|
|
|
|
|
acl
: clausal modifier of noun (adjectival clause)
acl
は,名詞を修飾する定型/非定型節 (finite/non-finite clauses) を表す. 関係acl
は関係 advcl と対照的であり,後者は述語 (predicate) を修飾する副詞節に用いられる.関係acl
の主辞 (head) は被修飾名詞であり,依存部 (dependent) は名詞を修飾する節の主辞である.
the issues as he sees them
acl(issues, sees)
There are many online sites offering booking facilities .
acl(sites, offering)
I have a parakeet named cookie .
acl(parakeet, named)
I just want a simple way to get my discount .
acl(way, get)
Cette affaire à suivre \n This case to follow
acl(affaire, suivre)
この関係は付随的な描写 (optional depictives) としても用いられ,形容詞が名詞を修飾し,二次述語 (secondary predication) として働く.結果構文 (resultatives) や描写構文 (depictives) のさらなる議論については xcomp を参照されたい.
She entered the room sad
acl(She, sad)
He painted the model naked
acl(model, naked)
関係節 (relative clause) はacl
のインスタンスであり,定性 (finiteness) および埋め込み節における被修飾名詞の省略によって特徴づけられる.いくつかの言語では,伝統的な関係節のクラスにおける下位クラスとしてacl:relcl
を設けることがある.
I saw the man you love
acl:relcl(man, love)
言語によっては,fact もしくは report といった名詞のサブセットに対する定型節の補部 (complements) を許す.これらは概して関係節のようにふるまうが,依存部節内には省略要素が存在しない.これはHuddleston and Pullum 2002における”内容節 (content clauses)”に該当するものであり,acl
として分析される.
the fact that nobody cares
acl(fact, cares)
advcl
: adverbial clause modifier
副詞節を成す修飾句 (adverbial clause modifier) は動詞や他の述語 (形容詞など) を修飾する節であり,必須の補部 (core complement) ではなく,修飾句としてふるまう.これには時間を示す節 (temporal clause),帰結節 (consequence),条件節 (conditional clause),目的節 (purpose clause) といったものが含まれる.依存部 (dependet) には必ず節 (もしくは advmod であるもの) をとり,依存部は節の主述語 (main predicate) である.
The accident happened as night was falling
advcl(happened, falling)
If you know who did it, you should tell the teacher
advcl(tell, know)
He talked to him in order to secure the account
advcl(talked, secure)
He was upset when I talked to him
advcl(upset, talked)
advmod
: adverbial modifier
語の副詞的修飾句 (advervial modifier) とは,adverb もしくは,述語や修飾語として働く副詞句を指す.
いくつかの伝統文法においては,副詞的修飾句 (adverbial modifier) という用語は,副詞,側置詞句 (adpositionnal phrases) や特定の形態的 cases のいずれかとして実現されるような,副詞として機能する構成要素 (constituents) を包括するものである.UDでは副詞類を,副詞として実現する (advmod) と,名詞句や側置詞句 (obl) として実現するものの間に区別を設ける.ただし,述語の修飾句 (狭義の副詞類) と,他の形容詞や副詞における修飾句 (修飾語句 (qualifiers) と呼ばれることがある) は区別されない.これらは全てadvmod
に包含される.
Genetically modified food
advmod(modified, Genetically)
less often
advmod(often, less)
Where/ADV do/AUX you/PRON want/VERB to/ADP go/VERB later/ADV ?/PUNCT
advmod(go, Where)
advmod(go, later)
About 200 people came to the party
advmod(200, About)
amod
: adjectival modifier
名詞 (もしくは代名詞) の形容詞的修飾句 (adjectival modifier) とは,名詞 (代名詞) の意味を修飾するような形容詞句を指す.
Sam eats red meat
amod(meat, red)
Sam took out a 3 million dollar loan
amod(loan, dollar)
Sam took out a $ 3 million loan
amod(loan, $)
There is nothing wrong with it
amod(nothing, wrong)
appos
: appositional modifier
名詞の同格修飾句 (appositional modifier) とは先頭の名詞の直後に後続する名詞を指し,名詞に対して定義,修飾,名付け,もしくは記述を行うものである.同格修飾語には括弧内にある要素や略語も含まれる.
Sam , my brother , arrived
appos(Sam-1, brother-4)
Bill ( John 's cousin )
appos(Bill-1, cousin-5)
The Australian Broadcasting Corporation ( ABC )
appos(Corporation-4, ABC-6)
appos
は2つの名詞の間に用いられる.概して,同格構造における2つの要素は交替が可能であるため,例えば_My brother, Sam, arrived.と言うことができる.
この構文に類似するものとして,肩書き (titles) といったものがある.肩書きは_state senator Paul Mnuchin のように完全な名詞句ではなく,交替が不可能であったり,完全な名詞句を形成するためには限定詞の挿入が必要だったりする.ラテン語由来である文法の伝統において,そのような_state senator_は「固定同格構造」と呼ばれ,名前 (Paul Mnuchin) が主辞として扱われる.しかし,ここでは名詞句が2つではなく,1つしか生起しないと考えられる.例:
President Obama
*Obama President
state senator Paul Mnuchin
*Paul Mnuchin state senator
そのような事例ではappos
を用いるべきでないが,通常は完全形に変えることが可能である.これはラテン語の伝統である「緩い同格構造」に相当し,完全な句が2つ生起することとなる.その場合,関係appos
は適格である:
Paul Mnuchin , the senior Oregon state senator
appos(Mnuchin-2, senator-8)
大体の場合では適格だが,境界となる事例も存在する.フォーマルな文書では同格構造を示す印として句読点 (punctuation) が用いられるが,句読点が無い同格構造の事例も確かに存在する:
the leader of the militant Lebanese Shiite group Hassan Nasrallah
appos(group-8, Hassan-9)
flat(Hassan-9, Nasrallah-10)
同格構造を判別する良いテストとして,2つの要素が共に名詞かどうか,交替可能かどうか,格や一致 (agreement) が存在するかどうか (形態論が豊富な言語において) を確認することが挙げられる:
I met the French actor Gaspard Ulliel
nsubj(met-2, I-1)
det(actor-5, the-3)
amod(actor-5, French-4)
obj(met-2, actor-5)
appos(actor-5, Gaspard-6)
flat(Gaspard-6, Ulliel-7)
I met Gaspard Ulliel the French actor
nsubj(met-2, I-1)
obj(met-2, Gaspard-3)
flat(Gaspard-3, Ulliel-4)
det(actor-7, the-5)
amod(actor-7, French-6)
appos(Gaspard-3, actor-7)
I met Gaspard Ulliel , the French actor
nsubj(met-2, I-1)
obj(met-2, Gaspard-3)
flat(Gaspard-3, Ulliel-4)
punct(Gaspard-3, ,-5)
det(actor-8, the-6)
amod(actor-8, French-7)
appos(Gaspard-3, actor-8)
I met French actor Gaspard Ulliel
nsubj(met-2, I-1)
amod(actor-4, French-3)
obj(met-2, actor-4)
flat(actor-4, Gaspard-5)
flat(actor-4, Ulliel-6)
省略 (abbreviations) といった項目は概して交替可能であるが,上記で示した限定詞テストはうまく作用しない.限定詞は同格構造の主要な項目に属するものと考えられるからである:
The ABC ( Australian Broadcasting Corporation )
appos(ABC-2, Corporation-6)
1つより多い同格名詞句が現れることは稀であり,それらの名詞は全て,先頭の名詞を修飾するものとして標示される.
Sam , my brother , John 's cousin , arrived
appos(Sam-1, brother-4)
appos(Sam-1, cousin-8)
しかし,埋め込まれた同格構造を完全に排除することはできない.それは等位接続との組み合わせで生起することがある:
You can choose between four subjects , language ( German or French ) , economy , technology and art .
appos(subjects, language)
conj(language, economy)
conj(language, technology)
conj(language, art)
cc(art, and)
appos(language, German)
conj(German, French)
cc(French, or)
appos
は住所や署名ブロックなどにおける,キー・値を結合するときにも用いられる.(list ラベルも参照):
Steve Jones Phone: 555-9814 Email: jones@abc.edf
flat:name(Steve-1, Jones-2)
list(Steve-1, Phone:-3)
list(Steve-1, Email:-5)
appos(Phone:-3, 555-9814-4)
appos(Email:-5, jones@abc.edf-6)
aux
: auxiliary
節の aux
(補助動詞 (auxiliary) ) とは動詞述語と連結する機能語を指し,時制 (tense),アスペクト (aspect),ヴォイス (voice) もしくはエビデンシャリティ (evidentiality) といったカテゴリを表現する.補助動詞は動詞であることが多いが,多数の言語では動詞でないTAMEマーカーを持っており,これらも同様にaux
のインスタンスとして扱われる.
New from v2: 受動の voice を構成するのに用いられてきた補助動詞は,現在ではaux
としてラベル付けされる.しかし,文法化した (周辺的な) 受動態を備えた言語においてはaux
のサブタイプであるaux:pass
を用いることが強く推奨される
Reagan has died
aux(died-3, has-2)
He should leave
aux(leave-3, should-2)
Do you think that he will have left by the time we come ?
aux(think, Do)
aux(left, will)
aux(left, have)
case
: case marking
関係case
は格を付与する要素を指し,個別の統語要素 (前置詞,後置詞,および接語である格マーカーを含む) として扱われるものに該当する. 格付与要素は名詞の依存部 (dependents) として扱われ,名詞へ付加したり名詞を導入したりする.(ゆえに,SDとは逆に,UDでは被修飾語と目的語を媒介する要素としてみなす見方を退ける) 関係case
は,名詞的要素,前置詞および形態論が豊富な言語における格に対して統一的な分析を与えることを志向している: 斜格 (oblique case) の名詞句は側置詞から導入される名詞句と同一の依存構造を持つ.
the Chair 's office
det(Chair-2, the-1)
nmod(office-4, Chair-2)
case(Chair-2, 's-3)
the office of the Chair
det(office-2, the-1)
nmod(office-2, Chair-5)
case(Chair-5, of-3)
det(Chair-5, the-4)
French:
le bureau du président \n the office of the_Chair
det(bureau, le)
nmod(bureau, président)
case(président, du)
Hebrew:
hwa/PRON rah/VERB at/PART[Case=Acc] h/DET klb/NOUN \n he saw ACC the dog
obj(rah-2, klb-5)
case(klb-5, at-3)
格マーカーが形態素である場合,格の依存部 (case dependet) の独立した要素として名詞を分離することができず,(述語の依存部であるならば) 名詞全体が obl として分析され,もしくは (名詞の依存部であるならば) nmod として分析される.明示的に格を標示するには, POSタグ と 素性 といった情報が用いられ,それは以下のロシア語の例から示される. (追加の統語形態論的素性を参照するには,当該の語にマウスを重ねること.)
# I wrote the letter with a quill.
1 Я ja PRON _ Case=Nom|Number=Sing|Person=1|PronType=Prs 2 nsubj _ I
2 написал napisat' VERB _ Gender=Masc|Number=Sing|VerbForm=Part|Voice=Act 0 root _ wrote
3 письмо pis'mo NOUN _ Case=Acc|Gender=Neut|Number=Sing 2 obj _ the-letter
4 пером pero NOUN _ Case=Ins|Gender=Neut|Number=Sing 2 obl _ with-a-quill
このように取り扱うことで,多様な構文間と多くの言語内に対して平行性を与えることができる.(ただし,これらの格において) ここで得られた良い結果として,前置詞句と従属節との間にある平行性を捉えられたことが挙げられる.(ただし,これらの例では関係 mark が用いられる):
Sue left after the rehearsal
nsubj(left-2, Sue-1)
obl(left-2, rehearsal-5)
det(rehearsal-5, the-4)
case(rehearsal-5, after-3)
Sue left after we did
nsubj(left-2, Sue-1)
advcl(left-2, did-5)
mark(did-5, after-3)
nsubj(did-5, we-4)
構文の平行的な分析は,以下のものに対しても与えられる.
- 受動交替 (possessive alternation)
the Chair 's office
det(Chair-2, the-1)
nmod(office-4, Chair-2)
case(Chair-2, 's-3)
the office of the Chair
det(office-2, the-1)
nmod(office-2, Chair-5)
case(Chair-5, of-3)
det(Chair-5, the-4)
- フィンランド語における,格,前置詞,もしくは後置詞における異形態 (variant forms)
etsiä ilman johtolankaa \n to_search without clue.PARTITIVE
obl(etsiä, johtolankaa)
case(johtolankaa, ilman)
etsiä taskulampun kanssa \n to_search torch.GENITIVE with
obl(etsiä, taskulampun)
case(taskulampun, kanssa)
etsiä johtolangatta \n to_search clue.ABESSIVE
obl(etsiä, johtolangatta)
- 二重目的語構文の分析が前置詞構文の分析と類似するような与格交替 (dative alternation)
give the children the toys
obj(give, toys)
iobj(give, children)
give the toys to the children
obj(give, toys)
obl(give, children)
case(children, to)
# give the toys to the children
1 donner donner VERB _ VerbForm=Inf 0 root _ give
2 les le DET _ Definite=Def|Number=Plur 3 det _ the
3 jouets jouet NOUN _ Gender=Masc|Number=Plur 1 obj _ toys
4-5 aux _ _ _ _ _ _ _ _
4 à à ADP _ _ 6 case _ to
5 les le DET _ Definite=Def|Number=Plur 6 det _ the
6 enfants enfant NOUN _ Gender=Masc|Number=Plur 1 obl _ children
この新しい分析を採るもう一つの利点として,”be”の述語補部となる前置詞句への対処法を提供することにある. この分析は名詞述語補部の扱いと一貫している:
Sue is in shape
nsubj(shape-4, Sue-1)
cop(shape-4, is-2)
case(shape-4, in-3)
前置詞が積み重なる場合 (前置詞が連続するとき),可能な分析が2つある.前置詞の連続が特定の意味を伴う固定したものである場合,fixed
が最良の分析法となる.関連する英語の例として out of がある:
Out of all this , something good will come .
case(this-4, Out-1)
fixed(Out-1, of-2)
det(this-4, all-3)
obl(come, this-4)
しかし,前置詞の様々な組み合わせによって異なる意味やニュアンスが表現される場合,各前置詞は格依存部として独立に分析される.関連する英語の例には up beside (down beside や up near と交替可能) や,as during もしくは except after と交替可能なexcept during が挙げられる.
The cafe up beside the lookout
det(cafe-2, The-1)
case(lookout-6, up-3)
case(lookout-6, beside-4)
det(lookout-6, the-5)
nmod(cafe-2, lookout-6)
cc
: coordinating conjunction
cc
は,接続要素 (conjunct) と先行する coordinating conjunction との関係を表す.
Bill is big and honest
conj(big, honest)
cc(honest, and)
等位接続詞 (coordinating conjunction) は文頭にも現れる場合がある.これは,先行する接続要素がない場合であってもcc
と呼ばれる.
And then we left .
cc(left, And)
ccomp
: clausal complement
動詞もしくは形容詞の節補部 (clausal complement) とは必須項として生起する依存部節を指し,動詞や形容詞の目的語のように機能する.
He says that you like to swim
ccomp(says, like)
mark(like, that)
He says you like to swim
ccomp(says, like)
そのような節補部は定型節か非定型節のどちらでもありうる.しかし,節補部の主語がコントロールされる場合 (つまり,上位の節の主語か目的語と同一であり,かつ他の解釈を許さない場合),適切な関係は xcomp である.
The boss said to start digging
ccomp(said, start)
mark(start, to)
We started digging
xcomp(started, digging)
ここでの重要な相違点は,最初の文で上司 (the boss) が掘削をしない解釈が許される一方,2番目の文では digging の主語が明らかに we しか許容されない.これは,ccomp
とxcomp
を区別づけるものである.
さらに,ccomp
は完全な節 (full clauses) が関与する等価構文 (equational constructions) においても用いられる.
The important thing is to keep calm.
ccomp(is, keep)
nsubj(is, thing)
The problem is that this has never been tried .
ccomp(is, tried)
nsubj(is, problem)
(これらの例では,節境界の緊密性 (integrity) を保持し,1つの述語が2つの述語に割り当てられることを防ぐため,コピュラが主辞として扱われる.これは,名詞句の一つが主辞として扱われるような等価構文の分析を考えたとき最適な解決策とはいえない.しかし,現行の枠組みでは選好される策である.)
注意: SD/USDの従来のバージョンでは,fact や reportといった名詞の補部節もccomp
として分析された.しかし,ここではacl として分析するため,名詞句にはccomp
が生起しない.名詞句は通常必須項をとらないため,この扱い方が合理的である.
clf
: classifier
clf
(類別詞 (classifier) ) は,特定の統語環境において名詞に付随する語を指す.最も標準的な使用法は数の類別詞 (numeral classifiers) であり,対象物を数えるために用いられる.通常,類別詞は名詞におけるある種の概念分類を反映しており,それは原理的に指示物 (referents) の特性に基づいている.
類別詞は語源的に名詞であるため,それらは名詞としても独立に用いられる.しかし,類別詞として用いた場合は,その意味が希薄となる.
大抵の場合で,類別詞に対してはNOUNが最も適したUPOSとなるが,類別詞としての特別なステータスを示すための素性を与えたくなるかもしれない.(類別詞に対する普遍的な素性は存在しないが,NounType=Clf
が適しているだろう.)
関数clf
は,類別詞の文法化した体系を備える言語に対して利用することを志向している.そのような傾向が最も強い言語はアジア諸語である.
主要な類別詞だけでなく、”massifiers”と呼ばれる,類別詞に類似した数の数え方をする他の語が存在する.,
これらには容器 (“cup”, “box”) や単位 (“mouth”, “inch”) が含まれ,中国語の一袋米 [one bag rice] ‘a bag of rice’における袋 ‘bag’ といったものが該当する.
類別詞を用いる言語においては,これらの語を類別詞として分析することが最も適切である.
他の言語では数を数える際に単位 (units) を用いるが,英語といった言語に対してはclf
は用いられず,標準的な名詞句の関係が依然として用いられる (英語を含め,多くの事例で文法化の兆候がみられるとしても)
英語の例については,本ページの最後を参照されたい.
See the examples for English at the end.
以下,関東語/普通話中国語の例である:
- 三个学生 (三個學生) sān gè xuéshēng = “three students”, literally “three [human-classifier] student”
- 三棵树 (三棵樹) sān kē shù = “three trees”, literally “three [tree-classifier] tree”
- 三只鸟 (三隻鳥) sān zhī niǎo = “three birds”, literally “three [bird-classifier] bird”
- 三条河 (三條河) sān tiáo hé = “three rivers”, literally “three [long-wavy-classifier] river”
統語的には,この類別詞は名詞ではなく数詞とグループを形成する.ゆえに,新たな関係clf
を用いて,類別詞は数詞 (所有格表現) の機能的依存部として扱われる.(これはGreenbergの普遍性の一種であり,他の全ての事例にも該当する.いくつかの例外は Aikhenvald (2000: 105) の Classifiers (OUP) で言及されているが,この文献で取り上げられる言語において,いわゆる主辞名詞は属格形で顕著にみられる.)
ときおり,類別詞が指示詞と名詞の間に挿入されることがある (数詞や名詞のかわりに) [zh]:
類別詞を示す語は様々な構文でも生起するが,個別言語における類別詞とUDで提案されたものを区別することが重要である.ここで,中国語の類別詞の例についてさらに検討したい.
名詞が生起せず,数や類別詞だけが生起する場合がある.このとき,類別詞が欠けた名詞の役割を埋め,類別詞を主辞へ昇格 (promote) させる.よって, 我 買 兩 本 “I am buying two” は “I am buying two [books-CLF]” とみなされる.
中国語を含むいくつかの言語では類別詞が数を伴わずに生起することがあり,ある種の決定詞の機能を表すことが頻繁にある.そのような類別詞の使用においてはdet
が用いられる.例えば広東語の‘She bought a/the book’は次のように分析される:
高度に文法化した類別詞の体系を備えない言語においては,事物が (“massifiers” を伴って) グループとして数えられる場合であっても,標準の名詞修飾関係が用いられる.例えば,英語では:
compound
: compound
関係compound
は,複合表現 (multiword expressions; MEWs) の3つの関係のうち1つ (他の2つはfixed
と flat
) を指す.compounds
は以下の例に対して用いられる;
- 任意のX0 複合: 複合名詞 (例: phone book) や,英語以外の言語でより一般的な動詞・形容詞の複合語 (ペルシア語や日本語における軽動詞構文 (light verb construction)) といったもの)
Phone book
compound(book, Phone)
- 不変化詞 (particle) を伴う動詞 (サブタイプ
compound:prt
として記述される):
put up
compound:prt(put, up)
- 動詞の連結 (サブタイプ
compound:svc
として記述される):
Musa bé lá èbi \n Musa came took knife
nsubj(bé, Musa)
compound:svc(bé, lá)
obj(bé, èbi)
関係compound
は (他のサブタイプを含めて) 不変化詞を伴う動詞との類似性があるものの,再帰形 (reflexive morpheme) を伴う再帰動詞とのリンクを構成しない.現行のUDガイドラインでは,この構文を関係 expl の subtype として定めている.
conj
: conjunct
接続要素 (conjunct) とは,_and_や_or_といった等位接続詞 (coordinating conjunction) で連結した2つの要素間の関係を指すものである.これらの要素は非対称的に扱われる: この関係の主辞は先頭の要素であり,他の全ての要素は関係conj
に依存する.
Bill is big and honest
conj(big, honest)
等位節の取り扱いは,構成要素が他のタイプであっても同様である:
He came home , took a shower and immediately went to bed .
conj(came, took)
conj(came, went)
punct(took, ,-4)
cc(went, and)
場合として等位接続は_asyndetic_であることがあり,接続詞が省略される.カンマや他の句読点記号は典型的に等位要素を限定する.言語によってはAsyndeticな等位接続が頻繁に用いられる,2つの要素間に常に接続詞が生起する言語もある.
Veni , vidi , vici .
conj(Veni, vidi)
conj(Veni, vici)
punct(vidi, ,-2)
punct(vici, ,-4)
Shared Dependents and Effective Parents in Coordination
現行の基本タグ付けスキームでは.先頭の接続要素の依存部と等位接続全体で共有される依存部とを区別できないことに注意したい.
He met her at the station and kissed her .
conj(met, kissed)
nsubj(met, He)
vs.
He met her at the station and she kissed him .
conj(met, kissed)
nsubj(met, He)
nsubj(kissed, she)
対照的に,拡張表示 (enhanced representation) によって依存関係を追加することで,1つ目の例における_he_が_kissed_の主語であることもエンコードできる:
He met her at the station and kissed her .
conj(met, kissed)
nsubj(met, He)
nsubj(kissed, He)
さらに,拡張表示は等位接続の親 (parent) と各要間の関係を捉えることができる.ただし,実際の親は手続き的に発見されることもあり,それを明示することは便宜上のものにすぎない.一方で,共有された依存部に関する情報は拡張表示を用いなければ示すことができない.
I saw that he met her at the station and kissed her .
conj(met, kissed)
nsubj(met, he)
nsubj(kissed, he)
ccomp(saw, met)
ccomp(saw, kissed)
依存部が等位要素間で共有される場合,基本表示は常に最初の要素 (等位接続の主辞) へと結合させる一方,拡張表示は全ての依存関係を示す.以下の例では,拡張表示でしか形成されない関係が赤色で示される.
# visual-style 6 1 amod color:red
# visual-style 4 3 amod color:red
# visual-style 6 3 amod color:red
1 American _ _ _ _ 4 amod 6:amod _
2 and _ _ _ _ 3 cc _ _
3 British _ _ _ _ 1 conj 4:amod|6:amod _
4 professors _ _ _ _ 0 root _ _
5 and _ _ _ _ 6 cc _ _
6 students _ _ _ _ 4 conj 0:root _
等位接続のネスト
基本的なタグ付けスキームでは,_apples and pears or oranges and lemons._といったネストした等位構造に対しては非常に限られた分析しか与えることができない.例えば,次の等位構造を考えてみたい
- A, B, C
- (A, B), C
- A, (B, C)
1番目と2番目の場合 (i.e. (A, B, C), ((A, B), C)) は同じツリーとして表示される.
A B C
conj(A, B)
conj(A, C)
右側にネストする場合 (A, (B, C)) はツリーが異なるため,これに限って他と区別が可能となる.
A B C
conj(B, C)
conj(A, B)
cop
: copula
cop
(コピュラ) は,主語と動詞以外の述語を連結するのに用いられる関係を指す.コピュラは動詞であることが多いが,動詞以外 のコピュラを多く使用する言語もある.コピュラ動詞は,VERB
ではなくAUXとタグ付けされる.そして,代名詞コピュラはPRONもしくはDETが付与される.
関係cop
は述語の意味にTAMEカテゴリを加えるような純粋なコピュラに対してのみ用いるべきであり,大抵の言語は最大1つのコピュラしか持たないことになる.そして,cop
は動詞以外の述語が節の主辞であるような場合にのみ適用するべきである.
具体的に言えば,西欧言語の多くでは英語の_to be_に相当するものだけが関係cop
として生起できる.スペイン語や,それに関連する言語においては,ser_と_estar_の両方がコピュラとなる.チェコ語や,それに関連する言語においては,_být と bývat の両方がコピュラとなる (これらは同じ語彙素 (lexeme) の異形態である.2つの語が見出し語 (lemma) として認定されるのは,チェコ語等においてアスペクト関連の形態論 (aspect-related morphology) が派生形態論として扱われるからである.)
対照的に,to become_に相当する表現は伝統文法とは異なりコピュラとしては扱われない. 存在の_to be_は,等価を表す節で用いられる動詞と同一である場合に限り,コピュラとして扱われる _(John is a teacher). ある言語内で異なる2つの動詞を用いる場合,存在を表す動詞はコピュラとしては扱われない.このトピックに関する義議論は here にアーカイブされている.
Bill is honest
nsubj(honest, Bill)
cop(honest, is)
Ivan is the best dancer
nsubj(dancer-5, Ivan-1)
cop(dancer-5, is-2)
det(dancer-5, the-3)
amod(dancer-5, best-4)
コピュラのbeではなく,上記に示した動詞以外の述語が節の主辞として扱われる.
そのような分析は,以下のロシア語の例で示すように,多くの言語では明示的なコピュラを頻繁に,もしくは常に欠くという事実によって動機づけられる:
Ivan lučšij tancor \n Ivan best dancer
nsubj(tancor, Ivan)
amod(tancor, lučšij)
インフォーマルな英語でもコピュラの省略が起こる.
Email usually free if you have Wifi.
nsubj(free, Email)
同一のコピュラが用いられる (もしくはコピュラを欠く) とした場合,述語が前置詞であってもこの分析は適用される.そのようなケースでは,前置詞句の名詞部分が節の主辞となる.
Sue is in shape
nsubj(shape, Sue)
cop(shape, is)
case(shape, in)
コピュラが他の助動詞を伴う (時制やアスペクトといった要素を表す) 場合,それらに対しては平板構造 (flat structure) が与えられ,語彙的述語の依存部として扱われる:
Sue has been helpful
nsubj(helpful, Sue)
cop(helpful, been)
aux(helpful, has)
この方略を採る動機として,この構造が動詞に伴う補助動詞に対する説明と平行的であることがある. 特に英語といった言語においては,分詞を動詞か形容詞のどちらとして扱うかが困難である.以下の文は,そのような事例に相当する:
The presence of troops will be destabilizing .
nsubj(destabilizing, presence)
cop(destabilizing, be)
aux(destabilizing, will)
このような事例であっても品詞を同定する必要が生じるが,品詞の選択によって依存構造が変わることは望ましくない.ただし,コピュラ構文の正確な分布は言語によって変異を見せることに注意されたい.
動詞以外のコピュラが節の形式を取るとき,関係cop
は用いられない.この形式は以下の例のような等価構文 (equational construction) において頻繁に生起する:
The important thing is to keep calm .
ccomp(is, keep)
nsubj(is, thing)
The problem is that this has never been tried .
ccomp(is, tried)
nsubj(is, problem)
コピュラ動詞ではなく節の述語を主辞としたとき,その文は2つの主語を持つことになるため,この方略は効果的でない.上記の例だと先頭の名詞句を述語として分析できるかもしれないが,この解決策が望ましいとは言えず,beの左右両方に節が存在する例を説明することができない: (For us) to not attempt to solve the problem is (for us) to acknowledge defeat. (注意: この解決策は完璧なものではないので,これを改良することが今後の方針として考えられる.)
csubj
: clausal subject
節主語 (clausal subject) とは,節の統語的な主語を指す.すなわち,主語それ自身が節となるようなものである.この関係の支配項 (governor) はいつでも動詞だとは限らない:動詞がコピュラ動詞であるとき,節の根 (root) はコピュラ動詞の補部となる.このときの依存部は主動詞や,主節における他の述語である.以下の例にあるwhat she said (すなわち said) は,それぞれmakesとinterestingの節主語となる.
v2から: 関係csubj
は動詞の受身形や特定の動詞グループにも用いられるようになった.そのとき,文法化した受動変形が起きる言語においては,サブタイプのcsubj:pass
を用いることが強く推奨される.
What she said makes sense
csubj(makes, said)
What she said is interesting
csubj(interesting, said)
What she said was well received
csubj:pass(received, said)
dep
: unspecified dependency
依存部は,それ以上正確な関係が同定できない場合にはdep
ラベルを付与することが可能である.これは,奇妙にみえる文法構造や,パージングを行うソフトウェアの限界を原因とするものであり,dep
は可能であるなら用いるべきでない.
det
: determiner
限定詞 (det
) は名詞句の主辞と determiner の関係を形成する.一般的に,POSタグの DET
は関係det
を持ち,その逆も成立する.知られている例外には次のものがある:
- データセットのいくつかでは [en] my といった所有限定詞 (possessive determiner) にPOSタグの
DET
だけでなくnmod も付与されるため,他の所有構文と並行的に扱われることになる.ただし,言語間では完全に並行的とはいえない; いくつかの言語では,どのように所有限定詞を形容詞と関係づけるかが英語よりも明確である場合があり,このことは当然関係nmod
にも該当する.
The man is here
det(man, The)
Which book do you prefer ?
det(book, Which)
discourse
: discourse element
関係discourse
は interjections や 談話の particles を示すのに用いられる (表現に関わるものを除き,文構造と結び付けられることはない). UDではPennツリーバンクがINTJと認定するものに対するガイドラインに従う. この定義では,次のものが含まれる: 間投詞 (interjection; oh, uh-huh, Welcome),フィラー (um, ah),談話標識 (discourse markers; well, like, actually しかし,you knowは含まない)
これらの談話要素は,関連性が最も高い節の主辞へ付加される.この理由から,談話要素は動詞の依存部でないのにも関わらず,必須でない節の依存部とグループ化される.
Iguazu is in Argentina :)
discourse(is-2, :)-5)
dislocated
: dislocated elements
関係dislocated
は前置もしくは後置した要素に用いられ,必須である文の文法関係を満たさない. これらの要素は文の周辺部 (periphery) に生起することが多く,カンマやイントネーションによって分離する場合がある.
この関係は文のトピックを導入するような前置要素に用いられ,以下の日本語およびギリシア語の例から示される.転移要素 (dislocated element) は節の主辞に付加される:
象 は 鼻 が 長い \n zoo wa hana ga naga-i \n elephant TOPIC nose SUBJ long-PRES
dislocated(長い-5, 象-1)
to jani ton kserume poli kala \n the John-Acc him know-1pl very well
dislocated(kserume, jani)
しかし,トピックの標示を受け,当該文の主語でもあるような名詞には用いられない; この場合,nsubj となる.
また,この関係は後置要素にも用いられる.転移要素は同一の支配項 (governor) に付加され,右方転移要素 (Right dislocated elements) は話言葉で頻繁に用いられる.以下はフランス語とギリシア語の例である.
Il faut pas la manger , la plasticine \n It must not it eat , the playdough
obj(manger, la-4)
dislocated(manger, plasticine)
obj(eat, it-13)
dislocated(eat, playdough)
ton kserume oli mas edho poli kala, to jani
dislocated(kserume, jani)
expl
: expletive
関係expl
とは虚辞 (expletive) や冗語 (pleonastic) を表す名詞句を指す.これらは述語の項位置に生起する名詞句ではあるが,それら自身は述語のいずれの意味役割 (semantic role) も満たさない.節の主述語 (動詞,叙述形容詞もしくは名詞) が支配項となる.英語において,it や there のいくつかは虚辞に該当する: 外置構文 (extraposition construction) における存在のthereやit.
(itやthereは虚辞でない用法もある).
There is a ghost in the room
expl(is, There)
It is clear that we should decline .
expl(clear, It)
自由なpro-drop (明示的な代名詞の代わりにゼロ照応 (zero-anaphora) が使える) を有する言語によっては,英語のような虚辞を持たないものもある.
この種の虚辞を持つ言語では,虚辞は必須項が生起する場所に位置することができる: 以下の例に見られる主語と直接目的語 (間接目的語も) のスロット.これらの例の分析において,後置主語 (postposed subject) や節内の項は規則的な必須項として扱われ,虚辞はexpl
として標示される.
There is a ghost in the room
expl(is, There)
nsubj(is, ghost)
obl(is, room)
I believe there to be a ghost in the room
nsubj(believe, I)
expl(believe, there)
xcomp(believe, be)
nsubj(be, ghost)
obl(be, room)
It is clear that we should decline .
expl(clear, It)
csubj(clear, decline)
That we should decline is clear .
csubj(clear, decline)
I mentioned it to Mary that Sue is leaving
nsubj(mentioned, I)
expl(mentioned, it)
obl(mentioned, Mary)
ccomp(mentioned, leaving)
関係expl
に関連する第二の使用法は,真正な二重接語 (true clitic doubling) に関するものである.接語や語彙的名詞句が相補的分布を示す言語 –”Kayneの一般化”に従うようなフランス語等の言語–において,接語と語彙的名詞句のどちらが生起したとしても,obj もしくは iobjといった適切な意味役割を受ける.口語フランス語など,そのような言語で接辞の二重化が起きた場合,語彙的名詞句を dislocated としてみなすことが正しい分析の仕方となる (例を参照),そのような事例において当該の分析は,名詞句が別の名詞句もしくは名詞句の項位置を埋める代名詞を二重化させる分析と同一になるだろう.
しかし,ギリシア語やブルガリア語といった他言語においては語彙的名詞句や代名詞的接語の二重化を許すとはいえ,前者では述語の項として標準的な役割を持つ.これらの事例では,語彙的名詞や接語のうち1つのみが節に現れた場合に限り,どちらが生起しようとも obj,iobj 等の役割が付与される – 他言語における語彙的名詞句と代名詞の扱いに並行して, 接語代名詞は文中の異なる位置に生起する.
しかし,両者が生起した場合,名詞句はobjとiobjなどの文法役割を得る.そして,接語は代名詞のコピーとして扱われ,それ自身の意味役割を得ないためexpl
の役割を得る. これは上述した英語の_it_と_there_の扱いと並行的であり,このとき別の句が述語の意味役割を満たす. ギリシア語とブルガリア語の例は以下に示される:
Της τον έδωσε της Καίτης τον αναπτήρα \n PRON.Fem.Gen PRON.Masc.Acc gave ART.Fem.Gen Keti.Gen ART.Masc.Acc lighter.Acc
expl(έδωσε, Της-1)
iobj(έδωσε, Καίτης)
det(Καίτης, της-4)
expl(έδωσε, τον-2)
obj(έδωσε, αναπτήρα)
det(αναπτήρα, τον-6)
Marija mu izprati pismo na rabotnika \n Maria 3.S.M.IO sent letter to the.worker
expl(izprati, mu)
obj(izprati, pismo)
iobj(izprati, rabotnika)
case(rabotnika, na)
再帰代名詞
虚辞の関係は再帰動詞 (reflexive verbs) へ付加する再帰代名詞 (reflexive pronouns) にも用いらる (素性 u-feat/Reflex を参照せよ).再帰代名詞とは再帰代名詞なしでは生起しない動詞を指し,ゆえに代名詞が通常の目的語の役割を果たさない (一方で,再帰代名詞は通常の代名詞や他の名詞句との置き換えが可能である).
UDでは再帰代名詞 (接語) に複数の機能を認めており,これらは関係expl
のサブタイプを用いることで区別される (このアプローチが認められることは 2015 Uppsala discussion of clitics を参照されたい.):
- expl:pv は,元々が再帰動詞であるもの (いくつかの文法において代名詞動詞 (pronominal verbs) と呼ばれるもの) に付加する再帰接語 (reflexive clitics) に対して用いられる
- expl:pass は,他動詞に付加する再帰接語に用いられヴォイスのマーカー (受身や逆使役を表す) としてふるまう
- expl:impers は,亜人格的な使用 (impersonal usage) に対して用いられる (自動詞と共に用いられる場合もある)
チェコ語の例:
Martin se bojí zvířat . \n Martin REFLEX fears animals .
expl:pv(bojí, se)
expl:pv(fears, REFLEX)
虚辞のさらなる一般的は議論については Postal, P. M., and G. K. Pullum (1988) “Expletive Noun Phrases in Subcategorized Positions,” Linguistic Inquiry 19(4): 635–670 を参照されたい. 二重接語 (clitic doubling) のステータスや,代名詞コピーの一種である接辞の項となる語彙的名詞句に対する議論については,特にBoris Harizanov (2014) Clitic doubling at the syntax-morphology interface: A-movement and morphological merger in Bulgarian. Natural Language and Linguistic Theory で行われている.
fixed
: fixed multiword expression
関係fixed
は,複合表現 (multiword expressions; MWEs) に用いられる3つの関係のうち,その1つを指す (他の2つはflat および compound).
fixed
は機能語もしくは短い副詞句として振る舞うような,文法化した固定表現に対して用いられる.
New from v2: 関係の適用範囲にまつわる誤解を防ぐ目的で,関係fixed
は従来のmwe
と置き換えられる
MWEにおけるfixed
の適用範囲は,おおよそ Sag et al. のfixed expressionsカテゴリに相当し,準固定表現 (semi-fixed) や可変性のあるMWE (flexible MWEs) は排除される.
固定したMWEは平板構造 (flat structure) としてタグ付けされる.MWEにおいて先頭の語に後続するすべての語は,ラベルfixed
を用いて先頭の語に付加させる.これらの表現は内部の統語構造を持たず (歴史的な観点を除くと),構造のタグ付けは原理的に恣意的になってしまう.ただし実践上の理由から,全ての言語において一貫したタグ付けを固定したMWEに与えることが望ましい.
I like dogs as well as cats
fixed(as-4, well-5)
fixed(as-4, as-6)
He cried because of you
fixed(because, of)
Je préfère prendre un dessert plutôt qu' une entrée \n I prefer getting a dessert rather than an appetizer
fixed(plutôt, qu')
flat
: flat multiword expression
flat
は,UDにおいて複合表現 (multiword expressions; MWEs) の3つの関係のうちの1つを表す関係である.(他の2つは fixed と compound). 関係flat
は名称 (Hillary Rodham Clinton) や日付 (24 December) といった,外心的 (exocentric; 主辞を欠く) な準固定的MWE (semi-fixed MWEs) に用いられる.これは,完全に固定的な (機能語のような) MWE (in spite of) や内心的 (endocentric; 主辞を持つ) なMWE (_apple pie_のような) 複合語 (compound) と対比される.
平板型MWW (flat MWEs) は平板構造としてタグ付けされ,後続する語は全て先頭の語にflat
ラベルを用いて付加させる.これは,平板構造を持つ表現は内部の統語構造を持たず,構造のタグ付けが恣意的になってしまうという想定にもとづく.どのような言語であっても平板型MWEには一貫したタグ付けを与えることが非常に望ましい.
以下,言語間で共通する平板型 (flat) の最も一般な用法をみることにする.意味的には等しい表現であっても言語によっては標準的な統語構造が異なる場合もある (また,同じ言語内であっても) ため,異なる分析を要することもある.
名称 (Names)
多くの言語では複合表現から成る固有名のうち,内部構造が不明瞭でどれが主辞なのかがはっきりしないものが存在する.このような名称に対しては関係flat
を用いてタグ付けする (サブタイプflat:name
は任意である).
Hilary Rodham Clinton
flat(Hilary, Rodham)
flat(Hilary, Clinton)
Carl XVI Gustaf
flat(Carl-1, Gustaf-3)
flat(Carl-1, XVI-2)
New York
flat(New, York)
肩書き/敬称も関係flat
から分析される.ただし,肩書きによっては固有の内部構造をもつものもあるので,そのような構造はflat
に埋め込んだ形で表示する:
Mr. Smith
flat(Mr., Smith)
President Obama
flat(President, Obama)
French actor Gaspard Ulliel
amod(actor-2, French-1)
flat(actor-2, Gaspard-3)
flat(actor-2, Ulliel-4)
Milliardär Ross Perot \n billionaire Ross Perot
flat(Milliardär-1, Ross-2)
flat(Milliardär-1, Perot-3)
しかし,肩書きや名称が2つの分離した名詞句から成るように思われる場合,flat
による分析は適切でなく,u-dep/apposによる分析のほうがふさわしい.このような事例には,カンマといった記号から名詞句が区切られる場合もあれば,インフォーマルなテキストでカンマが生起しない場合もある.このとき,2要素が逆転可能かどうかを尋ねるテストを行うと良い; 逆転可能なら,appos
で分析した方がよいだろう; 以下がその例である.
上記のものとは対照的に,名称には_The Lord of the Rings_や_Captured By Aliens_のように通常の統語関係によってタグ付けすべき事例もある.
The Lord of the Rings
det(Lord, The)
nmod(Lord, Rings)
case(Rings, of)
det(Rings, the)
The king of Sweden
det(king-2, The-1)
nmod(king-2, Sweden-4)
case(Sweden-4, of-3)
修飾構造が明瞭である組織名については,次の例のように依存関係が標準の統語関係から修飾構造を示せると良い:
Natural Resources Conservation Service
amod(Resources-2, Natural-1)
compound(Conservation-3, Resources-2)
compound(Service-4, Conservation-3)
加えて,標準的な統語関係は次のようにも用いられる: (a) タグ付けする言語 (以下の分析はフランス語・ドイツ語・スペイン語には適用されるが,英語には適用されない) で観察される場合 (b) 当該の機能語の元々の役割が消失する程には文法化が進行していない場合,これらの関係は (1) 修飾を行う限定詞やその他の機能語に対して (2) 埋め込み構造を形成する前置詞句・文に関与する名称・記述を結合する目的で用いられる.
Le Japon
det(Japon-2, Le-1)
Ludwig van Beethoven
case(Beethoven, van)
nmod(Ludwig, Beethoven)
Miguel de Cervantes y Saavedra
conj(Cervantes, Saavedra)
cc(Saavedra, y)
case(Cervantes, de)
nmod(Miguel, Cervantes)
Río de la Plata
case(Plata-4, de-2)
det(Plata-4, la-3)
nmod(Río-1, Plata-4)
上記の_Ludwig van Beethoven_ と _Miguel de Cervantes y Saavedra_では,_van_や_de_が前置詞だと仮定した上で分析を行なっている.この分析は名称が与えられる元の言語内では正しいだろうが,外国のテキストで用いられた場合や,文法化が十分に進んだとみなされる場合には異なる分析を受けるだろう.例えば,上のような名称を英語でタグ付けするならばflat
として分析するほうが適切である:
Ludwig van Beethoven was a famous German composer .
flat(Ludwig, van)
flat(Ludwig, Beethoven)
det(composer, a)
amod(composer, famous)
amod(composer, German)
cop(composer, was)
nsubj(composer, Ludwig)
punct(composer, .)
Río de la Plata
flat(Río-1, de-2)
flat(Río-1, la-3)
flat(Río-1, Plata-4)
Al Arabiya is a Saudi-owned news organization
flat(Al-1, Arabiya-2)
nsubj(organization-7, Al-1)
現代ドイツ語もしくはフランス語において,これらの前置詞は姓 (familiy name) の一部として定着しており,名 (given name) を伴わずに生起することがよくある.この場合でも,flat
による分析は正しいと考えられる:
Von Hohenlohe gewann das Rennen . \n Von Hohenlohe won the race .
flat(Von-1, Hohenlohe-2)
nsubj(gewann-3, Von-1)
_Leland Stanford Jr. University_といった人名にちなんだ存在物の固有名では,関係flat
は人名の内部のみに適用される.そして,残りの部分は通常の統語関係を用いて構成的に分析される:
Leland Stanford Jr. University
compound(Leland-1, University-4)
flat(Leland-1, Stanford-2)
flat(Leland-1, Jr.-3)
名称の関係に対する覚書
このパラグラフでは,名称構造の関係について過去にあった議論を簡潔にまとめている.これらは歴史的に様々な議論が展開されており,現在でもそれらのいくつかは議論が続いている.
_French actor Gaspard Ulliell_のような例: いくつかのツリーバンクでは_Mr._や_French actor_のような肩書きや敬称にはnmod
を用いるが,多くの人はこれを不適切だと考えている.なぜなら,nmod
の依存部は完全な句であって,格言語 (cased language) においては句の格として修飾語の格をとるべきだからである.対照的に,肩書きはそれに後続する名称と同じ句に属するように思われる; 格言語では一致 (agreement concord) をみせる.
文法的な慣習 (ラテン語に由来) では,上のような_French actor_は”固定化した側置詞 (fixed apposition)” と呼ばれ,名称 (Gaspard Ulliell) を主辞にとる.
UDは関係appos
の用法を次のような”緩い同格関係” (appositives; ラテン語の”緩い (広い) 同格”に対応する) に限定している; appos
は,2つの完全な名詞句が緩やかに結合し,かつカンマといった記号によって分離された場合のみに用いられる.よって,上記の例にappos
を用いるのは正しくない.また,関係compound
が使われることもあったが,これも正しくないように思われる.これは主辞性 (headedness) を思わせ,肩書き (titles) が複合語とは通常異なるふるまいをみせる; ドイツ語は, 肩書きでは後続語に付加しない一方, 複合語は通常付加する. また, ドイツ語の複合語は最後部の要素が主辞であり, ヘブライ語の複合語は先頭要素が主辞であるが, 両言語とも複合語が名称の先頭に生起する,
よって,どちらの場合であってもcompound
は適切でないように思われる.
UDv1ツリーバンクのいくつかではflat
を_Mr._のような敬称に用いたが,これは奇妙に感じられるので,flat
を複合表現から成る固有名の結合にのみ用いるべきだと考える人もいる.
UDv2ではflat
は削除され,主辞を取らない要素のチャンクといった広い概念を許容するflat
を採用した.UDv2のガイドラインでは肩書きと敬称のどちらの事例であってもflat
によって名称と結合するように定めている.
日付と複雑な数値
日付は言語によって様々な表現がある._the 4th of July_のように明瞭な統語構造をみせ,通常の依存関係からタグ付けされる言語もあれば,_1 December 2016_のように平板構造をとり,関係flat
で分析すべき言語もある.
the 4th of July
det(4th, the)
nmod(4th, July)
case(July, of)
1 December 2016
flat(1, December)
flat(1, 2016)
関係flat
は句構造を欠く他の数値や数表現にも用いられる.
four thousand
flat(four, thousand)
外国語のフレーズ
関係flat
(サブタイプのflat:foreign
は任意) は,構成的な分析を受けない外国語のフレーズに対しても適用される.
この事例において.かつてv1で用いられた関係foreign
はflat
に置き換えられる.
And then she went : gjiko frac zen .
parataxis(went, gjiko)
flat(gjiko, frac)
flat(gjiko, zen)
goeswith
: goes with
関係goeswith
は,編集がうまく行われず,語の2つ以上の部分に分離しているものを結合する関係を指す.これらの部分は当該言語の書記法において,1つの語として記載されるべきである.その主辞は常に先頭の部分であり,他の部分は関係goeswith
を用いて先頭要素へ付加させる (記述の一貫性に配慮し,flat, fixed および conj に似せてある).
また,最後の部分はSpaceAfter=No
とタグ付けされる場合があるため注意したい.
They come here with out legal permission
goeswith(with-4, out-5)
never the less/[SpaceAfter=No] ,
goeswith(never, the)
goeswith(never, less)
iobj
: indirect object
動詞の間接目的語 (indirect object) は,動詞の必須項 (core argument) ではあるが,主語や (直接) object ではないような名詞句を指す.典型例には,交換を表す,二重目的語を取る動詞の受領者 (recipient) がある:
She gave me a raise
iobj(gave, me)
nsubj(gave, She)
しかし,多くの言語では他の意味役割も間接目的語として許容する.最も一般的な事例としては受益者 (benefactive) があるが,他言語では他の役割,例えば,以下のKinyarwanda語の例が示す道具 (instrument),もしくはcomitative といったものも含む.もう一方の極として,あらゆる間接目的語を欠く言語も存在する.
Umukoóbwa a-ra-andik-iish-a íbárúwa íkárámu \n girl 1-PRS-write-APPL-ASP letter pen
obj(a-ra-andik-iish-a, íbárúwa)
iobj(a-ra-andik-iish-a, íkárámu)
形態 cases を区別する言語において,間接目的語は与格 (dative case) として標示されることが多い.しかし,動詞の結合価 (valency) が,直接目的語が与格を持つ,あるいは間接目的語が他の様々な形式をとるように定めることもある.
以下のチェコ語の例では,動詞が項を2つとり,両者が共に対格 (accusative case) として実現している.そのうち一方は直接目的語 (被動作主) であり,もう一方は間接目的語 (聞き手) である.これは,英語の対訳に対して与えられるタグ付け (形態格の標示がない場合において) と平行的であり,授与動詞 (verbs of giving) の分析とも平行的である (類似した文として,_he gave my daughter a class of maths_を考えてほしい).
On učí mou dceru matematiku . \n He teaches my daughter.Acc maths.Acc .
obj(učí, matematiku)
iobj(učí, dceru)
obj(teaches, maths.Acc)
iobj(teaches, daughter.Acc)
一般的に,目的語が1つしか存在しない場合,形態格や意味役割の種類に関わらず obj とタグ付けされる.例えば,英語の_teach_は,教科 (subject matter) や生徒 (recipient) のどちらであっても唯一の目的語にとれる.よって,両者は共に obj として分析される:
She teaches introductory logic
obj(teaches, logic)
She teaches the first-year students
obj(teaches, students)
この分析は,Huddleston and Pullum (2002) “The Cambridge Grammar of the English Language”, 4章4節 (p. 251) のものと整合している.この文献で述べられるように,自動詞/他動詞の交替において,同じ意味役割が主語になったり目的語になったりしても,それには違いが生じない.
list
: list
list
は列挙される項目に用いられる関係を指す.2つより多くの項目を含むリストにおいて,全ての項目は先頭の項目を修飾するものとして考えられる.インフォーマルなテキストやウェブ上のテキストにはリストとして解されるフレーズを含むことが多いが,単一の文としてパージングされる.電子メールの署名では,このような構造を連絡情報という形式で表すことが多い: 別の連絡情報は,それぞれがlist
としてラベル付けされる; キーと値のペア関係は appos としてラベル付けされる.
Steve Jones Phone: 555-9814 Email: jones@abc.edf
flat:name(Steve-1, Jones-2)
list(Steve-1, Phone:-3)
list(Steve-1, Email:-5)
appos(Phone:-3, 555-9814-4)
appos(Email:-5, jones@abc.edf-6)
list
が用いられる他の箇所として,レビューのタイトルとして用いられる,所属や記載事項の欄がある (製品やレストランのレビューなど):
Long Lines , Silly Rules , Rude Staff , Ok Food
list(Lines, Rules)
list(Lines, Staff)
list(Lines, Food)
ただし,list
の過剰な使用は避けるべきである.等位接続が用いられるなど,通常の文に適用される文法関係から容易に分析できる構文においては,リストのような体裁を持っていても通常の関係から分析するべきである.
mark
: marker
マーカー (marker) とは,ある節が別の節の従属節を形成していることを示すような語を指す.complement clause においては,[en] that
や whether. といった語に相当する.adverbial clause においては,マーカーは [en] while or although といった subordinating conjunction が典型である.このマーカーは従属節の主辞に対する依存部となる.relative clause でマーカーとなるのは,通常屈折をせず,単に関係節を導入するような [he] še. (関係節¥において,mark
である [en] who or that といった関係節マーカーと,動詞の項や修飾語として働く [en] who or that のような関係代名詞とを区別する必要がある.) といった語である.
Forces engaged in fighting after insurgents attacked
mark(attacked, after)
He says that you like to swim
mark(like, that)
不定節 (infinitival clauses) における不定節マーカー (英語の_to_やドイツ語の_zu_など) も,mark
として付加される.
Er kam wieder , um das Werk zu Ende zu bringen \n He came again , so-that the work to end to bring
mark(bringen, um)
mark(bringen, zu-10)
mark(bring, so-that)
mark(bring, to-22)
nmod
: nominal modifier
nmod
は他の名詞の依存部である名詞句を表す関係であり,機能的には.この名詞句は属性 (attribute) や,属格の補部 (genitive complement) に相当する.
New from v2: 関係 nmod
は従来,動詞,形容詞や副詞の依存部となる名詞句に対して用いられた.このような関係は,現在では obl という新たな関係によって示される..
case と同じく,nmod
は所有交替に対して一貫した分析を提供する (後置修飾をとらないケースと区別するため,nmod:poss
という選択肢もある):
the office of the Chair
det(office-2, the-1)
nmod(office-2, Chair-5)
case(Chair-5, of-3)
det(Chair-5, the-4)
the Chair 's office
det(Chair-2, the-1)
nmod:poss(office-4, Chair-2)
case(Chair-2, 's-3)
nsubj
: nominal subject
名詞句主語 (nsubj
) は,節の統語的主語やプロト行為者 (proto-agent) を表す名詞句を指す.名詞句主語はすなわち,主語性 (subjecthood) に関する典型的な文法テストに合格するような節の場所に位置し,この項は行為性 (agentive) が高く,行為者であったり節のプロト行為者であったりする.この名詞句の主辞となるのは,名詞,もしくは代名詞や関係代名詞,または省略 (ellipsis) が起きる文脈では形容詞といったものが該当する.
New from v2: 動詞が受身形を表し,結合価 (valency) が変更されたことで主語が典型的にプロト行為者を表さない場合であっても,その名詞句主語には関係nsubj
が用いられる.文法化した受動変形を有する言語においては,上記の事例に対して,nsubj
のサブタイプnsubj:pass
を用いることが強く推奨される.
関係nsubj
の支配項 (governor) は常に動詞だとは限らない: 動詞がコピュラ動詞 (copular verb) である場合,節の根 (root) はコピュラ動詞の補部であり,形容詞,および前置詞で修飾されたものを含む名詞となる.これは,以下の例から示される.
nsubj
の役割は述語の意味項に対してのみ適用される.文法的な主語位置に空の項 (empty argument) が存在する (この要素は虚辞 (expletive) と呼ばれることがある) とき,それは expl としてラベル付けされる.英語における,存在を表す_there_構文のように,分離 (displaced) した主語が存在する節においては,主語はnsubj
としてラベル付けされる.
Clinton defeated Dole
nsubj(defeated, Clinton)
Dole was defeated by Clinton
nsubj:pass(defeated, Dole)
The car is red .
nsubj(red, car)
Sue is a true patriot .
nsubj(patriot, Sue)
We are in the barn .
nsubj(barn, We)
Agatha is in trouble .
nsubj(trouble, Agatha)
There is a ghost in the room .
expl(is, There)
nsubj(is, ghost)
These links present the many viewpoints that existed .
acl(viewpoints, existed)
nsubj(existed, that)
nummod
: numeric modifier
名詞に対する数の修飾語は number であり,名詞を数量によって修飾する.
Sam ate 3 sheep
nummod(sheep, 3)
Sam spent forty dollars
nummod(dollars, forty)
Sam spent $ 40
nummod($, 40)
few や many といった不定の数量詞 (quantifier) は u-pos/NUM ではなく,u-pos/DET としてタグ付けされることに注意.よって,このような数量化をうけた名詞はnummod
ではなく,det としてタグ付けされる:
Sam ate many sheep
det(sheep, many)
obj
: object
動詞の目的語 (object) は,主語に後続する,動詞の2番目の必須項 (core argument) である.目的語は典型的に,行為を受けたり,状態変化もしくは動作を経験するような事物を表す (プロト被動作主).
She gave me a raise
obj(gave, raise)
形態 cases を区別する言語において,目的語は対格 (accusative case) として標示される.ただし,動詞の結合価 (verb valency) は,以下のドイツ語の例が示すように与格 (dative case) といった,他の形式を取るように指定する場合がある:
jemandem begegnen \n someone.Dat to-meet
obj(begegnen, jemandem)
一般的に,目的語が1つだけ生起する場合,それは形態格や意味役割の種類に関わらずobj
としてラベル付けされる.2つ以上の目的語が存在する場合,1つはobj
,もう1つは iobj となる.そのような事例では,どれが最も影響を受けた目的語 (patient) なのかを決定する必要がある.
目的語を複数とる構文に関するさらなる議論は,iobj のページにある.可能なら,1番目の (もしくは直接) 目的語を同定させるような言語固有のドキュメンテーションがあることが望ましい.
obl
: oblique nominal
関係obl
は,必須でない項 (斜格; oblique) や付加詞 (adjunct) として機能するような名詞句 (名詞,代名詞,名詞句) に対して用いられる.このことは,必須でない項が動詞,形容詞,もしくは他の副詞に付加する副詞と機能的に対応することを意味する.
関係obl
は格 (case) によってさらなる指定を受ける.関係 case と同様,obl
は以下の事例に対して一貫した分析を提供する:
- フィンランド語の例に示される,格,前置詞もしくは後置詞による名詞の異形 (variant):
etsiä ilman johtolankaa \n to_search without clue.PARTITIVE
obl(etsiä, johtolankaa)
case(johtolankaa, ilman)
etsiä taskulampun kanssa \n to_search torch.GENITIVE with
obl(etsiä, taskulampun)
case(taskulampun, kanssa)
etsiä johtolangatta \n to_search clue.ABESSIVE
obl(etsiä, johtolangatta)
- 二重目的語構文 (double object construction) に類似した分析を受ける,与格交替 (dative alternation)
give the children the toys
obj(give, toys)
iobj(give, children)
give the toys to the children
obj(give, toys)
obl(give, children)
case(children, to)
# give the toys to the children
1 donner donner VERB _ VerbForm=Inf 0 root _ give
2 les le DET _ Definite=Def|Number=Plur 3 det _ the
3 jouets jouet NOUN _ Gender=Masc|Number=Plur 1 obj _ toys
4-5 aux _ _ _ _ _ _ _ _
4 à à ADP _ _ 6 case _ to
5 les le DET _ Definite=Def|Number=Plur 6 det _ the
6 enfants enfant NOUN _ Gender=Masc|Number=Plur 1 obl _ children
obl
は時間や場所を表す名詞修飾語に対しても用いられる:
Last night , I swam in the pool
obl(swam, night)
obl(swam, pool)
また,動詞受身形の行為者 (任意的であり,サブタイプ obl:agentを伴う) に対しても用いられる.
the cat was chased by the dog
nsubj:pass(chased, cat)
obl:agent(chased, dog)
orphan
: orphan
関係’orphan’は,主辞の省略 (ellipsis) のうち,単純な昇格 (promotion) だと不自然で誤解を招くような依存関係について用いられる.典型例として,必須項 (core argument) が節主辞へ昇格するような述語 (predicate) の省略がある.
Marie won gold and Peter bronze
nsubj(won, Marie)
obj(won, gold)
conj(won, Peter)
cc(Peter, and)
orphan(Peter, bronze)
上記の例では,主語の_Peter_は2番目の選言肢の主辞位置へ昇格している.目的語_bronze_を主語へ付加することは節の緊密性 (integrity) を保持するために必要な操作であるが,_bronze_は_Peter_の目的語ではないため,objという通常の関係は誤解が生じる.よって,標準的な付加でないことを示すためにも関係orphan
が用いられるだろう.対照的に,上記の等位接続詞_and_は省略の有無に関わらず同じ機能を果たすので,通常の関係cc
が保持される.
更なる議論については,省略 (ellipsis) を参照されたい.
parataxis
: parataxis
並置関係 (parataxis relation; ギリシア語で”place side by side”を意味する) とは,語や他の要素 (文括弧や“:” “;”の後の節. 主辞との等位関係 (coordenation),従属関係 (subordination),項関係が明示されない.) の間にある関係を指す.並置関係は談話上の等位接続に相当し,類像的な順序(iconic ordering) に従 .よって,当該言語の主辞性 (headedness) を満たすかどうかに関わらず,通常は文の先頭部分が主辞となり,2番目の部分が並置関係の依存部となる.しかし,要素間に現れる括弧といった要因から事態はより複雑になる.
Let 's face it we 're annoyed
parataxis(Let, annoyed)
The guy , John said , left early in the morning
parataxis(left, said)
punct(said, ,-3)
punct(said, ,-6)
並置関係が適用される構文のリスト
Side-by-side sentences (“run-on sentences”)
並置関係は独立文であり得るが単一文として扱われるような文のペアに対して用いられる.この関係は,文末記号によって区切りが表され,コロンやカンマによって (もしくは,記号を用いることなしに) 複数の節が組み合わさることで成立する.話ことばコーパスでは,文としてラベル付けされるものが発話のターン (utterance turn) によって表現される.また,ツリーバンク使用者が文境界を設定するとき,2つの節を結合する談話的関係が明確である場合にもこの関係は成立する.この関係を設定する場合,等位接続に用いる分析との類似性を高めるために後部要素は全て1番目の要素の依存部として扱われる.
Bearded dragons are sight hunters , they need to see the food to move .
parataxis(hunters, need)
punct(need, ,)
この関係は対象のユニットが文よりも小さい場合でも成立することがある:
Divided world the CIA
amod(world, Divided)
parataxis(world, CIA)
det(CIA, the)
報告文 (reported speech) の扱い
報告文の例:
The guy , John said , left early in the morning
parataxis(left, said)
punct(said, ,-3)
punct(said, ,-6)
パラフレーズによって基本的に同じ意味を伝達することができるが,それらの統語構造は異なる.報告文が従属節に埋め込まれる (補文標識_that_の有無に関わらず) とき,その従属節は発言動詞 (speech verb) のccompとなる.発言動詞に報告文が後続し,それがコロンによって分離される場合,報告文は主節を形成し,先行する主節と並置 (parataxis)関係を結ぶ.しかし,発言動詞が括弧ないに生起する場合その関係は逆転し,発言動詞は報告文の並置 (parataxis)として扱われる.この分析に議論がないわけではないが,ここではHuddleston and Pullum (2002), The Cambridge Grammar of the English Language (11章9節を参照) といった著名な研究に従うことにしたい.
John said that the guy left early in the morning .
ccomp(said, left)
John said the guy left early in the morning .
ccomp(said, left)
John said : “ The guy left early in the morning . ”
parataxis(said, left)
punct(left, :)
punct(left, “)
punct(left, ”)
“ The guy left early in the morning ” , John said .
parataxis(left, said)
punct(said, ,)
punct(left, “)
punct(left, ”)
The guy left early in the morning , John said .
parataxis(left, said)
punct(said, ,)
The guy , he said , left early in the morning .
parataxis(left, said)
punct(said, ,-3)
punct(said, ,-6)
この分析の考え方とは,埋め込みとして分析された文ならば節全体にさらなる埋め込みを形成でき (I was taken aback when John said the guy left early in the morning.),中間部もしくは文末に発言動詞が生起する場合は埋め込みが形成できない (*I was taken aback when the guy left early this morning, John said.),というものである.
ニュース記事の署名欄 (News article bylines)
並置関係は,ニュース記事の署名欄にも設定される.他に優れた関係が存在しないように思われるからである.
Washington ( CNN ) :
parataxis(Washington, CNN)
punct(CNN, ()
punct(CNN, ))
punct(CNN, :)
間投詞的な節 (Interjected clauses)
単一語もしくは句の挿入 (interjections) はdiscourseとして分析されるが,節全体が挿入される場合は並置関係を用いる.
Calafia has great fries ( they are to die for ! )
parataxis(has, are)
punct(are, ()
punct(are, ))
Just to let you all know Matt has confirmed the booking for 3rd Dec is OK .
parataxis(confirmed, let)
2番目の例では,2番目の要素 (Matt has confirmed ..) を依存関係の主辞として扱う.1番目の要素 (Just to let ..)は節全体の挿入と考えられ,発話の主節ではないと思われるからである.
付加疑問 (Tag questions)
並置関係は_isn’t it?_や_haven’t you?_といった付加疑問にも用いられる.
It 's not me , is it ?
parataxis(me, is)
punct(is, ,)
punct
: punctuation
記号が依存関係において保持される場合,節内の記号 (punctuation) に関係punct
が用いられる.ただし,SYM によってタグ付けされるシンボルは記号 (punctuation) とは区別されるので,関係punct
によって付加させることができない.
Go home !
punct(Go, !)
関係u-dep/punct にあるトークンは常に内容語 (省略 (ellipsis) されたものを除く) に付加され,それは依存部 (dependents) を持たない.punct
は通常の依存関係にないため,主辞を決定する通常の規則が適用できない.かわりに,次の原則に従うことにする:
- 等位関係を形成するユニットを分離する記号は後続要素に付加される.
- 依存部ユニットに先行/後続する記号は,そのユニットに付加される.
- 関連するユニット内で,記号は投射性 (projectivity) が保持できる最も上位にあるノードへ付加される.
- 記号 (e.g. 引用符,括弧,ダッシュ,カンマその他) のペアは,投射性が保たれるならば同一の語へ付加される.その語とは,通常記号ペアに囲まれた句の主辞である.
他の例は並置 (parataxis) を参照されたい.
reparandum
: overridden disfluency
reparandum
は会話で生じた非流暢性 (disfluencies) を指し,後続する要素によって修復 (repair) される.非流暢部分は修復の依存部となる.r.
Go to the righ- to the left .
obl(Go-1, left-7)
reparandum(left-7, righ-)
case(righ-, to-2)
det(righ-, the-3)
case(left-7, to-5)
det(left-7, the-6)
root
: root
文法関係root
は文の根 (root) を指す.根に関して,仮想的なノードROOT
は支配項として用いられるが,文で生起する語のインデックスは1から始まるので,ROOT
のインデックスは0となる (ROOT
のノードはCoNLL-Uでは明示的に表されない).
ROOT I love French fries .
root(ROOT, love)
v2から: どのツリーであっても,依存関係root
を結ぶ1つのノードが存在しなければならない.主述語 (main predicate) が (省略によって) 生起しない場合,そして”orphaned dependent”が複数存在する場合,それらのうち1つが主辞 (根) へと昇格 (promote) し,他の”orphan”はそれに付加される. (この規則はv1.2から続くが,v1の元々のガイドラインでは明言されていない).
ROOT And Robert the fourth place .
root(ROOT, Robert)
cc(Robert, And)
orphan(Robert, place)
punct(Robert, .)
amod(place, fourth)
det(place, the)
vocative
: vocative
呼格 (vocative) 関係はダイアローグ内の参与者を標示するのに用いられる (会話,対話,eメール,ニュース投稿などでよく見られる). この関係は聞き手の名前とホストとなる文を結合する.呼格は一般的にゼロ主語 (null subject) と共起し,それは以下の1番目の例に示される.当該の名詞が意図的に呼格として用いられるのであれば,呼格関係を用いた方がよい.
Guys , take it easy!
vocative(take, Guys)
Marie , comment vas - tu ?
vocative(vas, Marie)
xcomp
: open clausal complement
動詞および形容詞の開いた節補部 (open clausal complement; xcomp
)とは,それ自身が主語を持たない述語・節の補部を指す.
よって,その主語は必然的にxcompの外部にある項から決定される (通常は上位節の目的語だが,主語からも決定される).これを指して,義務的コントロール (obligatory control)と呼ぶことが多い.これらの節は多くの言語において不定節 (non-finite) をとる傾向が強いが,定形節も存在する.xcomp
という名前はLFG (Lexical-Functional Grammar) からの借用である.
He says that you like to swim
ccomp(says, like)
Sue asked George to respond to her offer
xcomp(asked, respond)
obj(asked, George)
You look great
xcomp(look, great)
I started to work there yesterday
xcomp(started, work)
I consider him a fool
xcomp(consider, fool)
I consider him honest
xcomp(consider, honest)
We expect them to change their minds
xcomp(expect, change)
obj(expect, them)
上記の条件“それ自身が主語を持たない”とは,単に主語が_明示されていない_ため当該の節がxcomp
になるということではない.主語は上位節から継承されるのであって,下位節の主語が上位節の特定の役割から独立したという解釈が存在しないのである.以下の例にある,欠けた主語が上位節の特定の役割から独立する事例ではccomp
が代わりに用いられる.これには恣意的な主語 (arvitrary aubjects) や照応のコントロール (anaphoric control) も含まれる
The boss said to start digging
ccomp(said, start)
pro-drop言語には,主語が独立した語として生起しない節が存在することもあるが,この節は上位節の項に依存しているわけではない (内在的には主語があり,それは動詞形から推測が可能である).よって,以下のチェコ語の例では主語が明示されておらず,2つ目の例のみがxcomp
を有する.
Píšu , protože jsem to slíbil . \n I-write , because I-have it promised .
advcl(Píšu, slíbil)
advcl(I-write, promised)
Slíbil jsem psát . \n Promised I-have to-write .
xcomp(Slíbil, psát)
xcomp(Promised, to-write)
Secondary Predicates
関係xcomp
は_二次述語 (secondary predicates)_ もしくは_述語類 (predicatives)_と呼ばれる.
例:
- She declared the cake beautiful.
- She declared the cake a success.
上記の例は従属節を用いてパラフレーズが可能である: She declared that the cake was beautiful.
1つの節に2つの述語が混ざって生起している: 1. she declared something 2. the cake was beautiful (彼女の意見によると).
当該の二次述語はxcomp
として主述語に付加される.
She declared the cake beautiful .
nsubj(declared, She)
obj(declared, cake)
xcomp(declared, beautiful)
拡張版では,二次述語を示す主語が追加される.
She declared the cake beautiful .
nsubj(declared, She)
obj(declared, cake)
xcomp(declared, beautiful)
nsubj(beautiful, cake)
チェコ語の例:
jmenovat někoho generálem \n to-appoint someone as-a-general
obj(jmenovat, někoho)
xcomp(jmenovat, generálem)
xcomp
は節の述語における必須項 (core arguments) に用いられ,二次述語の他の要素には用いられない.例えば,_She entered the room sad_は述語を2重に持つ (she entered the room; she was sad) が,_sad_は_enter_の必須項ではない:_sad_は_enter_に対する文法的な影響や意味の変更をもたらさない.一方,_she declared the cake beautiful_の_beautiful_をそのままにしておくと,文が文法的でくなったり,_declared_の異なった解釈を生み出したりする.
a
つまり,_She entered the room sad_の_sad_は_She_に依存するのであって,その関係はxcomp
ではなくaclとなる.