|
|
TEI Lite( TEI U5 ) のメモ
【 訳 < メモ 】
(1998.8.) |
|
1 はじめに 12 リスト 2 簡単な例 13 書誌的引用 3 テキストの構造 14 テーブル(表) 4 本文のマークアップ 15 図と絵 5 ページ番号・行番号 16 解釈・分析 6 語句の強調 17 技術文書 7 注記 18 文字コード、他 8 相互参照とリンク 19 前文・後付 9 編集のための処置 20 TEI ヘッダ 10 省略・削除・付加 21 要素リスト 11 名前・日付・数値・略語 22 リファレンス |
|
TEI Lite(TEI U 5)L. バーナード、C.M.S. マックウィーン
■ TEI の簡単な入門用サブセット。
1995.6 http://www.uic.edu/orgs/tei/intros/teiu5.tei http://www.uic.edu/orgs/tei/intros/teiu5.split.html |
|
【参照】
|
|
1 はじめにTEI ガイドライン( TEI P3、1994.5)は、以下のような特徴を備えている。
The Oxford Text Archive は独自マークアップから SGML に変換するのに TEI Lite を使っている。ヴァージニア州立大学・ミシガン州立大学の電子テキストセンターも文書のマークアップを TEI Lite で行っている。 TEI (the Text Encoding Initiative)自身も本書を含む技術文書を TEI Lite に従って作成している。 |
|
2 簡単な例原文の体裁に忠実であることだけを目指したマークアップの例。−(1)原文、(2)そのマーク付け。 |
|
(1) CHAPTER 38 READER, I married him. A quiet wedding we had: he and I, the par- son and clerk, were alone present. When we got back from church, I went into the kitchen of the manor-house, where Mary was cooking the dinner, and John cleaning the knives, and I said -- 'Mary, I have been married to Mr Rochester this morning.' The housekeeper and her husband were of that decent, phlegmatic order of people, to whom one may at any time safely communicate a remarkable piece of news without incurring the danger of having one's ears pierced by some shrill ejaculation and subsequently stunned by a torrent of wordy wonderment. Mary did look up, and she did stare at me; the ladle with which she was basting a pair of chickens roasting at the fire, did for some three minutes hang suspended in air, and for the same space of time John's knives also had rest from the polishing process; but Mary, bending again over the roast, said only -- 'Have you, miss? Well, for sure!' A short time after she pursued, 'I seed you go out with the master, but I didn't know you were gone to church to be wed'; and she basted away. John, when I turned to him, was grinning from ear to ear. 'I telled Mary how it would be,' he said: 'I knew what Mr Ed- ward' (John was an old servant, and had known his master when he was the cadet of the house, therefore he often gave him his Christian name) -- 'I knew what Mr Edward would do; and I was certain he would not wait long either: and he's done right, for aught I know. I wish you joy, miss!' and he politely pulled his forelock. 'Thank you, John. Mr Rochester told me to give you and Marythis.' I put into his hand a five-pound note. Without waiting to hear more, I left the kitchen. In passing the door of that sanctum some time after, I caught the words -- 'She'll happen do better for him nor ony o' t' grand ladies.' And again, 'If she ben't one o' th' handsomest, she's noan faa\l, and varry good-natured; and i' his een she's fair beautiful, onybody may seethat.' I wrote to Moor House and to Cambridge immediately, to say what I had done: fully explaining also why I had thus acted. Diana and 474 JANE EYRE 475 Mary approved the step unreservedly. Diana announced that she would just give me time to get over the honeymoon, and then she would come and see me. 'She had better not wait till then, Jane,' said Mr Rochester, when I read her letter to him; 'if she does, she will be too late, for our honey- moon will shine our life long: its beams will only fade over your grave or mine.' How St John received the news I don't know: he never answered the letter in which I communicated it: yet six months after he wrote to me, without, however, mentioning Mr Rochester's name or allud- ing to my marriage. His letter was then calm, and though very serious, kind. He has maintained a regular, though not very frequent correspond- ence ever since: he hopes I am happy, and trusts I am not of those who live without God in the world, and only mind earthly things. |
|
この写しには、いくつか欠点がある。
TEI 方式を使うことによって、次のような区別がはっきりする。
TEI 方式では、次のようなマークアップも可能である。
他にも、大きな可能性がある。その一例。( TEI P3 を参照。)
|
|
3 テキストの構造TEI 準拠のテキストには TEI header (<teiHeader>...</teiHeader>) を付ける。ヘッダは、@ファイル情報、Aマークアップ情報、B文書情報、C更新履歴から成る。(「20」を参照。) テキストは単独の作品の場合もあり、詞華集のように複数の作品から成る場合もある。 単独の作品の構造は、次の形にまとめられるだろう。 |
|
<TEI.2> <teiHeader> [ TEI Header information ] </teiHeader> <text> <front> [ front matter ... ] </front> <body> [ body of text ... ] </body> <back> [ back matter ... ] </back> </text> </TEI.2> |
|
複合テキストの本文は、グループに分かれ、それぞれに前部・後付けを備える。 |
|
<TEI.2> <teiHeader> [ header information for the composite ] </teiHeader> <text> <front> [ front matter for the composite ] </front> <group> <text> <front> [ front matter of first text ] </front> <body> [ body of first text ] </body> <back> [ back matter of first text ] </back> </text> <text> <front> [ front matter of second text] </front> <body> [ body of second text ] </body> <back> [ back matter of second text ] </back> </text> [ more texts or groups of texts here ] </group> <back> [ back matter for the composite ] </back> </text> </TEI.2> |
|
個々のテキストにヘッダをつけ、定義を別にすることもできる。( TEI コーパス)ただし、コーパスの複合体を1つのオブジェクトとして扱うことは、現在の TEI ではできない。 |
|
<teiCorpus> <teiHeader> [header information for the corpus]</teiHeader> <TEI.2> <teiHeader>[header information for first text]</teiHeader> <text> [first text in corpus] </text> </TEI.2> <TEI.2> <teiHeader>[header information for second text]</teiHeader> <text> [second text in corpus] </text> </TEI.2> </teiCorpus> |
|
以下の章では、単純な文章を主に取りあげて、必要な要素と属性に触れていく。 | |
4 本文のマークアップTEI 文書の要素
前部・後付けの要素については、「19」を参照。 |
|
[SECTION TOP]
テキスト区分要素テキストは個々の段落(<p>)、又は章節項などの区分に分ける。(@すべて<div>、又はA段階に応じて<div1>から<div7>までの区分を作る。それ以上の区分がある場合は@によって初めからただの<div>をネストさせればよい。) <p>/<divX>の属性: id や n は、どの要素にも使える共通属性である。
id によって文書の階層構造を反映する例。(アダム・スミスの国富論 Wealth of Nations の章節項を示す。) |
|
<div1 id=WN1 n='I' type='book'> <div2 id=WN101 n='I.1' type='chapter'>... </div2> <div2 id=WN102 n='I.2' type='chapter'>... </div2> ... <div2 id=WN110 n='I.10' type='chapter'> <div3 id=WN1101 n='I.10.1' type=part>... </div3> <div3 id=WN1102 n='I.10.2' type=part>... </div3> </div2> ... </div1> <div1 id=WN2 n='II' type='book'> .... </div1> ... |
|
複数の書物で章が通し番号で振られている場合のタグ付け例。(章番号は n 属性で表し、 id 属性によって第何巻第何章であるかを示す。) |
|
<div1 id=TS01 n='1' type='Volume'> <div2 id=TS011 n='1' type='Chapter'> ... <div2 id=TS012 n='2'> ... </div1> <div1 id=TS02 n='2' type='Volume'> <div2 id=TS021 n='3'type='Chapter'> ... <div2 id=TS022 n='4'> ... </div1> |
|
[SECTION TOP]
見出しと終わり見出しタグの詳細は、「19」を参照。
見出しが要素や属性で表せれば、これらのタグは必要ない。他の方法では再現できない場合などに活用する。(トマス・ハーディの Under the Greenwood Tree の冒頭の例。) |
|
<div1 id=UGT1 n='Winter' type='Part'> <div2 id=UGT11 n='1' type='Chapter'> <head>Mellstock-Lane</head> <p>To dwellers in a wood almost every species of tree ... |
|
[SECTION TOP]
散文・韻文・戯曲特に韻文や戯曲・脚本等に用いるタグ。
タグ付けの実例。もし体裁上の行を保持するなら、 <lb> 要素を使う。(「5」を参照。) |
|
<lg n=I> <l>I Sing the progresse of a deathlesse soule,</l> <l>Whom Fate, with God made, but doth not controule,</l> <l>Plac'd in most shapes; all times before the law</l> <l>Yoak'd us, and when, and since, in this I sing.</l> <l>And the great world to his aged evening;</l> <l>From infant morne, through manly noone I draw.</l> <l>What the gold Chaldee, of silver Persian saw,</l> <l>Greeke brass, or Roman iron, is in this one;</l> <l>A worke t'out weare Seths pillars, bricke and stone,</l> <l>And (holy writs excepted) made to yeeld to none,</l> </lg> |
|
戯曲などで有韻文が話し手により分けて語られる場合、 part 属性でそれが断片であることを明示するのが簡単である。1つのスタンザを2人で分けて歌う場合などにも応用できる。 |
|
<div1 type ='Act' n='I'><head>ACT I</head> <div2 type ='Scene' n='1'><head>SCENE I</head> <stage rend=italic> Enter Barnardo and Francisco, two Sentinels, at several doors</stage> <sp><speaker>Barn<l part=Y>Who's there? <sp><speaker>Fran<l>Nay, answer me. Stand and unfold yourself. <sp><speaker>Barn<l part=i>Long live the King! <sp><speaker>Fran<l part=m>Barnardo? <sp><speaker>Barn<l part=f>He. <sp><speaker>Fran<l>You come most carefully upon your hour. |
|
rend 属性については、「6」を参照。 |
|
<sp><speaker>First voice</speaker> <lg type=stanza part=I> <l>But why drives on that ship so fast <l>Withouten wave or wind? </lg> <sp><speaker>Second Voice</speaker> <lg part=F> <l>The air is cut away before. <l>And closes from behind. </lg> |
|
散文の会話でも、マークアップ方法は同様である。 who 属性で会話の主を特定することができる。 |
|
<sp who=OPI><speaker>The reverend Doctor Opimiam</speaker> <p>I do not think I have named a single unpresentable fish. <sp who=GRM><speaker>Mr Gryll</speaker> <p>Bream, Doctor: there is not much to be said for bream. <sp who=OPI><speaker>The Reverend Doctor Opimiam</speaker> <p>On the contrary, sir, I think there is much to be said for him. In the first place.... <p>Fish, Miss Gryll -- I could discourse to you on fish by the hour: but for the present I will forbear... </sp> |
|
5 ページ番号・行番号改ページと改行は、次の空要素で示す。
ともに n 属性を使えるほか、 ed 属性によって版数(刷数)を示すことができる。(版によるページ区切りの相違を示す。)なお、行末のハイフネーションの扱いは一考を要する。 |
|
<p>I wrote to Moor House and to Cambridge immediately, to say what I had done: fully explaining also why I had thus acted. Diana and <pb ed=ED1 n='475'> Mary approved the step unreservedly. Diana announced that she would <pb ed=ED2 n='485'>just give me time to get over the honeymoon, and then she would come and see me. |
|
これらの要素は、テキスト内の参照位置を示す <milestone> 要素の特別なケースである。こちらは、列やセクションの開始などを示し、前記 ed 属性のほか、 unit 属性(セクションの種類を示す)を使える。版やセクションの種類を TEI ヘッダに明記しておくこと。また、 <pb> 、 <lb> と <milestone> とは勝手に混用すべきでない。 |
|
6 語句の強調フォントの変更強調語句はフォントやグリフ、色等の変更によって読者の注意を喚起する。 |
|
/→活字/ |
共通属性 rend (rendition) によって強調の仕方を示す。( rend='Bold'、 rend='Italic' 等) <hi> (hilight) は、それ自体では強調の種類を特定しない。 |
<hi rend=gothic>And this Indenture further witnesseth</hi> that the said <hi rend=italic>Walter Shandy</hi>, merchant, in consideration of the said intended marriage ... |
|
/→書誌/ |
強調の理由を明示できる場合、以下のような要素を使える。
引用や割り注のタグ( <q> 、 <gloss> )にも、必要なら rend 属性を付ける。 |
(1)
(2)
(3) |
|
(1)の文章の強調個所を解釈すれば、(2)のようなタグ付けになる。また、外見だけを叙述すれば、(3)のようなタグ付けになるだろう。 |
|
引用など引用符の性質を、できれば以下のように明示することを勧める。
引用の実例。 |
|
Few dictionary makers are likely to forget Dr. Johnson's description of the lexicographer as <q>a harmless drudge.</q> |
|
引用の形式(インライン、強調、ブロック引用等)を rend 属性で示すべきである。引用符の種類を表すにもこの属性を使える。 語り手の表白は、前後を引用で区切ることで示すことができる。 |
|
<p><q>Who-e debel you?</q> — he at last said —<q>you no speak-e, damme, I kill-e.</q> And so saying, the lighted tomahawk began flourishing about me in the dark. |
|
もし2つの引用を1つの会話としてつなぐことが意味をもつ場合には、リンク属性の next と prev が使える。(「8」を参照。) 引用部分の典拠や話者を示すには、 who 属性を使う。 |
|
<q who=Wilson>Spaulding, he came down into the office just this day eight weeks with this very paper in his hand, and he says:—<q who=Spaulding>I wish to the Lord, Mr. Wilson, that I was a red-headed man.</q></q> |
|
電子テキストの作成者は、引用符を残すか、タグで置き換えるかを決めなければならない。引用符を取り去る場合、 rend 属性によって原文の体裁を記録することができる。 また、強調の場合と同じく、強いて解釈するのでなく、単に <hi rend=quoted> で片づけるほうがよい場合もある。 |
|
外国語の表現共通属性 lang をタグに付加する。適切な該当要素がない場合、 <foreign> 要素に lang 属性を加えてタグ付けする。 |
|
Have you read <title lang=deu>Die Dreigroschenoper</title>? The court issued a writ of <term lang=lat>mandamus</term>. John has real <foreign lang=fra>savoir-faire</foreign>. <mentioned lang=fra>Savoir-faire</mentioned> is French for know-how. |
|
/→索引/ |
7 注記脚注・後注・欄外注その他、場所にかかわらず、メモや注釈には同じ <note> 要素を使う。
注記番号または識別値が必要な場合、 n 属性を使う。また、注釈が原注であるか、校訂・編集の注であるかを resp で明示するか、どの種類の注であるかを TEI ヘッダで述べること。 |
Collections are ensembles of distinct entities or objects of any sort. <note place=foot n=1>We explain below why we use the uncommon term <mentioned>collection</mentioned>instead of the expected <mentioned>set</mentioned>. Our usage corresponds to the <mentioned>aggregate</mentioned> of many mathematical writings and to the sense of <mentioned>class</mentioned> foundin older logical writings.</note> The elements ... |
|
<lg id=RAM609><note place=margin>The curse is finally expiated</note> <l>And now this spell was snapt: once more</l> <l>I viewed the ocean green,</l> <l>And looked far forth, yet little saw</l> <l>Of what had else been seen ‐</l> |
|
8 相互参照とリンクA拡張ポインタ B見えない形でのリンクを作る属性 @同一の SGML 文書内での単純な相互参照
<ptr> がポインタを作るだけの空要素であるのに対して、 <ref> は相互参照そのものを含むテキストをも含む。また、 <ptr> がシンボルやアイコン、ボタンといった言葉以外のものによるリンクを作るが、それは言葉によってリンクを作る文書生産システムでも役に立つ。 どちらにも共通して、以下の属性が使われる。
|
|
See especially <ref target=SEC12>section 12 on page 34</ref>. See especially <ptr target=SEC12>. |
|
target 属性の値は、その文書の SGML ID (を施した一節や句)である。次の例では、 <div1> 要素を参照している。 |
|
... see especially <ptr target=SEC12>. ... <div1 id=SEC12><head>Concerning Identifiers... ... |
|
id 属性は一般的なので、例えばパラグラフなどにも施すことができる。 |
|
... this is discussed in <ref target=pspec>the paragraph on links</ref> ... <p id=pspec>Links may be made to any kind of element ... |
|
targType 属性は、指し示される要素が特定のものであることを示す。この型が合わないと、参照は失敗する。 SGML パーサだけではこの適合性のチェックはできない。 |
|
... this is discussed in <ref target=dspec targType='div1 div2'> the section on links</ref> |
|
type 属性によってリンクを分類することができる。 resp 属性と crDate 属性も併せて使った例: |
|
... this is discussed in <ref type=xref resp=auto crdate=950521 target=dspec targtype='div1 div2'> the section on links</ref> |
|
/→8-B/ /→<s>/ |
単にリンクポイントを作るだけならば、 <anchor> 要素を置くだけでよい。ある語句をターゲットにするなら、 <seg> 要素を置けばよい。 type 属性を加えることで目的別に分類することができる。 |
.... <anchor type=bookmark id='ABCD'> .... .... <seg type=target id='EFGH'> ... </seg> ... |
|
A拡張ポインタ外部文書への参照をする場合には、 <xptr> 、 <xref> を使う。上記属性の他、 target 属性に代わって以下の属性を使う。
TEI 拡張ポインタのターゲットを表現する方法の詳細は、 TEI P3 ガイドラインを参照。 <xptr>(又は <xref>)は、 doc 属性にエンティティ名を補うだけで、他の文書全体を指すことができる。このためには、エンティティ名を litemods.ent 拡張ファイルに、又は使用している SGML オーサリング・ソフトに固有の方法で宣言しておかなくてはならない。(「15」を参照。) |
|
see <xref doc=P3>The TEI Guidelines, passim</xref> |
|
from 属性は、doc 属性で示された文書の中のある位置を示す。 TEI 拡張ポインタ構文に従って記述するが、かいつまんでいえば、指示位置は steps の並びで示され、各々の step は直前の step で示した位置からの相対的な位置を記述する。例えば、第2章の第2段落の3番目の文を指示するには、初めに第2章、次に第2段落、最後に第3文を指示するという具合である。書き方は SGML の考え方( parent 、 descendant 、 preceding 等。※下図参照。)によるか、あるいはもっと大まかに、テキストの型や字句の位置などでもよい。 SGML 記法でなくとも、同等のシステムで画像中の位置を指示することなどもできる。 from 属性と to 属性は、同じ記法を使う。拡張ポインタは、 from で示される場所の最初から、 to で示される場所の終わりまでの部分を指示するのである。 はじめに、ターゲットとなる文書中のある要素の ID を示す。 |
|
<xptr doc=P3 from='id (SA)'> |
|
これで P3 エンティティ中の SA 識別子で表される要素の全体を選ばれる。次のキーワードを使って、相互の関係によって他の要素を選ぶことができる。
それぞれに、例えば children (子要素の集合)、 ancestors (上位要素の集合)、 siblings (兄弟要素の集合)などが含まれる。明示のために次のものをカッコでくくったリストを続けてもよい。
上例の SA 識別子を持つ要素に含まれる第3段落を選択したもの。 |
|
<xptr doc=P3 from='id (SA) child (3 p)'> |
|
同様に、 P3 エンティティが TEI ガイドラインを参照しているとすれば、次は拡張ポインタ構文が規定されている同書の 14.2.2 節を選択している。 |
|
For full details, see<ref doc=P3 from='id (SA) child (2 div2) child (2 div3)'> TEI Extended pointer syntax definition </ref> |
|
次の例では、 from 属性と to 属性を使うことにより、文書の構造によらず、該当するすべての文書要素をターゲットとしている。(もちろん、 ABC の終わりが XYZ の始まりより先であったらエラーである。) |
|
<xptr doc=P1 from='id (xyz)' to='id (abc)'> |
|
この構文を使うことで、非常に複雑な記述が簡単にできる。次は、 lang 属性の値が LAT であり、最も SA の始まりに近い先行要素 <head> を選択したものである。 |
|
<xptr doc=P3 from='id (SA) preceding (1 head lang lat)'> |
|
もし doc 属性に何の値もなければ、現在の文書が対象となる。次の(1)、(2)は同じ意味を表す。 |
|
(1) <ptr target=X1> (2) <xptr from='id (X1)'> |
|
/→解釈/ |
B見えない形でのリンクを作る属性以下のリンク属性は TEI Lite DTD の共通属性で、特別な目的に使う。
ana 属性は、抽象的分析・解釈を記した部分を指示する。(「16」を参照。) |
/→解釈/ /→文法/ |
<seg type=sentence ana=SVO> <seg type=lex ana=NP1>John</seg> <seg type=lex ana=VVI>loves</seg> <seg type=lex ana=NP1>Nancy</seg> </seg> |
corresp 属性は、テキスト中の2つの要素が共通することを表す。多言語テキストで原語と翻訳語を結びつける例。 |
|
<seg lang=FRA id=FR1 corresp=EN1>Jean aime Nancy</seg> <seg lang=ENG id=EN1 corresp=FR1>John loves Nancy</seg> |
|
この機構は、例えばある語の前方照応関係を表すのにも応用できる。 |
|
<p><title id=shirley>Shirley</title>, which made its Friday night debut only a month ago, was not listed on <name id=nbc>NBC</name>'s new schedule, although <seg id=network corresp=nbc>the network</seg> says <seg id=show corresp=shirley>the show</seg> still is being considered. |
|
next 属性と prev 属性は、不連続の要素を互いにつなぐのに使う。 |
|
<q id=Q1a next=Q1b>Who-e debel you?</q> — he at last said — <q id=Q1b prev=Q1a>you no speak-e, damme, I kill-e.</q> And so saying, the lighted tomahawk began flourishing about me in the dark. |
|
9 編集のための処置次章にかけて、原文の体裁を保持し、かつ編集上の処置をも盛り込むための方法を述べる。 編集者(校訂者)が原文を「訂正」(correction) するための要素。
以下の要素は、「改正」(normalization) のための要素である。文脈の一貫性・今日的整合性などを目的とした変更である。
例えば、(1)の文は Gifford によって語句とスペルの誤りを指摘されている。(@ table は babbled の誤り、A a' は he の、 feelds は fields の誤記)彼の推測をマーク付けで表したのが(2)である。 |
|
(1) ... for his nose was as sharp as a pen and a' table of green feelds (2) ... for his nose was as sharp as a pen and <reg sic="a'">he</reg> <corr sic='table' ed=Gifford>babbl'd</corr> of green <reg sic='feelds'>fields</reg> |
|
10 省略・削除・付加省略・抹消個所を補い、原文の再現に必要な情報を補うための方法。
削除注記の実例を示す。(1)の衍字を削除することを、(2)で示す。 |
|
(1) The following elements are provided for for simple editorial interventions. (2) The following elements are provided for <del hand=LB>for</del> simple editorial interventions. |
|
原文で動詞を落としていた場合。 |
|
(1) The following elements provided for for simple editorial interventions. (2) The following elements <add hand=LB>are</add> provided for <del hand=LB>for</del> simple editorial interventions. |
|
同様に、原著者による原稿の校正などもマークアップできる。例えば、初稿の galls を抹消して dogs を挿入した場合は、次のようになる。 |
|
How it <del hand=DHL type=overstrike>galls</del> <add hand=DHL place=supralinear>dogs</add> me,what a galling shadow |
|
<unclear> 要素と <gap> 要素を同時に使って、判読不能部分の省略を示すことができる。(下の例では、補入候補を記述するために <add> タグを使っている。) |
|
One hundred & twenty good regulars joined to me <unclear><gap reason='indecipherable'></unclear> & instantly, would aid me signally <add hand=ed>in?</add> an enterprise against Wilmington. |
|
<del> 要素は、削除の旨を記しながら削除部分をテキストの一部分として記述するが、 <gap> 要素は判読の可否にかかわりなくテキストの省略個所を記すものである。コーパスなどでは、外国語の長い引用文は省略するかもしれない。 |
|
<p> ... An example of a list appearing in a fief ledger of <name type=place>Koldinghus</name> <date>1611/12</date> is given below. It shows cash income from a sale of honey.</p> <q><gap desc='quotation from ledger' reason='in Danish'></q> <p>A description of the overall structure of the account is once again ... </p> |
|
他のコーパスでは(特にスキャナが今日のように普及する以前のもの)、図や数式は省略されている。 |
|
<p>At the bottom of your screen below the mode line is the <term>minibuffer</term>. This is the area where Emacs echoes the commands you enter and where you specify filenames for Emacs to find, values for search and replace,and so on. <gap desc='diagram of Emacs screen' reason='graphic'> </p> |
|
11 名前・日付・数値・略語名前と称呼 (referring string)称呼とは人や場所、物などを参照する句である。
|
|
/→addr/ |
<q>My dear <rs type=person>Mr. Bennet</rs>, </q> said his lady to him one day, <q>have you heard that <rs type=place>Netherfield Park</rs> is let at last?</q> It being one of the principles of the <rs type=organization>Circumlocution Office</rs> never, on any account whatsoever, to give a straightforward answer, <rs type=person>Mr Barnacle</rs> said, <q>Possibly.</q> |
次の例では、 <rs> 要素が固有名詞(名詞句)の形をしていない場合も含めて、すべての人や場所等への参照句にタグ付けされている。 |
|
<q>My dear <rs type=person>Mr. Bennet</rs>,</q> said <rs type=person>his lady</rs> to him one day... |
|
これと対照的に、 <name> 要素は固有名詞だけから成る。 <rs> 要素と同じような意味に使うこともでき、また普通名詞と固有名詞の混ざった referring string では <rs> 要素の中にネストさせて使うこともできる。 名前を単に name でタグ付けしたのでは、参照のためには十分ではない。文章の中には、いつもきちんとした形で名前が出てくるわけではない。上記の要素や類似の要素に、以下の属性を付けることができる。
key 属性は、文書に散在する人名や地名へのすべての参照を集める手段として有益である。 |
|
<q>My dear <rs type=person key=BENM1>Mr. Bennet</rs>, </q> said <rs type=person key=BENM2>his lady</rs> to him one day, <q>have you heard that <rs type=place key=NETP1>Netherfield Park</rs> is let at last?</q> |
|
前述の reg (regularization) 属性が次のように称呼の標準化された形を記述するために使われるのと区別すること。 |
|
<name type=person key=WADLM1 reg='de la Mare, Walter'> Walter de la Mare </name> was born at <name key=Ch1 type=place>Charlton</name>, in <name key=KT1 type=county>Kent</name>, in 1873. |
|
日付と時間
value 属性は、 ISO 8601 等の形式に従う。省略形や範囲で示すこともできる。曖昧な表現でも、範囲の区切りが分かれば、 exact 属性で表すことができる。 |
|
<date value='1980-02-21'>21 Feb 1980</date> <date value='1990'>1990</date> <date value='1990-09'>September 1990</date> Given on the <date value='1977-06-12'>Twelfth Day of June in the Year of Our Lord One Thousand Nine Hundred and Seventy-seven of the Republic the Two Hundredth and first and of the University the Eighty-Sixth.</date> <l>specially when it's nine below zero <l>and <time value='15:00'>three o'clock in the afternoon</time> |
|
数字文字でも書かれるが、他の文字との区別は比較的明瞭である。区別のためには、 <num> 要素を使う。
|
|
<num value='33'>xxxiii</num> <num type=cardinal value='21'>twenty-one</num> <num type=percentage value='10'>ten percent</num> <num type=percentage value='10'>10%</num> <num type=ordinal value='5'>5th</num> |
|
略語とその展開略語をそのまま使う場合も展開する場合もあるだろう。マーク付けするには、以下の要素を使う。
<abbr> 要素は、頭文字や隠語などを区別するのに役に立つ。 |
|
We can sum up the above discussion as follows: the identity of a <abbr>CC</abbr> is defined by that calibration of values which motivates the elements of its <abbr>GSP</abbr>; Every manufacturer of <abbr>3GL</abbr> or <abbr>4GL</abbr> languages is currently nailing on <abbr>OOP</abbr> extensions. |
|
機能によって type 属性を使った例。 |
|
<name><abbr type=title expan='Doctor'>Dr.</abbr> <abbr type=initial expan='Marilyn'>M.</abbr> Deegan</name> is the Director of the <abbr expan='Computers in Teaching Initiative' type=acronym> CTI</abbr> Centre for Textual Studies. |
|
住所<address> 要素は、住所を示す。さらに、住所の各行を <addrLine> 要素で示す。 |
|
<address> <addrLine>Computer Center (M/C 135)</addrLine> <addrLine>1940 W. Taylor, Room 124</addrLine> <addrLine>Chicago, IL 60612-7352</addrLine> <addrLine>U.S.A.</addrLine> </address> |
|
住所の個別要素は、前述の <name> 要素を使う。 |
|
<address> <addrLine>Computer Center (M/C 135)</addrLine> <addrLine>1940 W. Taylor, Room 124</addrLine> <addrLine><name type=city>Chicago</name>, IL 60612-7352</addrLine> <addrLine><name type>=country>USA</name></addrLine> </address> |
|
/→索引/ |
12 リストリストには、番号つきリスト・番号無しリスト・用語リストなどがある。どれも項目の並びであり、項目のはじめにはラベル(用語リストでは用語そのもの)がある。
最初の <item> の前には、リストのヘッダとなる <head> を置いてもよい。リストの番号つけは不要であり、つける場合には n 属性を各項目につけるか、(まれに)<label> 要素を使う。 |
(1) <list> <head>A short list</head> <item>First item in list.</item> <item>Second item in list.</item> <item>Third item in list.</item> </list> (2) <list> <head>A short list</head> <item n=1>First item in list.</item> <item n=2>Second item in list.</item> <item n=3>Third item in list.</item> </list> (3) <list> <head>A short list</head> <label>1</label><item>First item in list.</item> <label>2</label><item>Second item in list.</item> <label>3</label><item>Third item in list.</item> </list> |
|
同じリストに異なったスタイルを混ぜるのはよくない。 用語集は term をラベルとしてタグ付けし、 gloss を項目(item)としてタグ付けする。この term , gloss と、普通のテキストのどこにでも置ける <term> 要素、 <gloss> 要素とは同じものである。 |
|
<list type=gloss> <head>Vocabulary</head> <label lang=enm>nu</label> <item>now</item> <label lang=enm>lhude</label> <item>loudly</item> <label lang=enm>bloweth</label> <item>blooms</item> <label lang=enm>med</label> <item>meadow</item> <label lang=enm>wude</label> <item>wood</item> <label lang=enm>awe</label> <item>ewe</item> <label lang=enm>lhouth</label> <item>lows</item> <label lang=enm>sterteth</label> <item>bounds, frisks</item> <label lang=enm>verteth</label> <item lang=lat>pedit</item> <label lang=enm>murie</label> <item>merrily</item> <label lang=enm>swik</label> <item>cease</item> <label lang=enm>naver</label> <item>never</item> </list> |
|
リストがもっと複雑な場合、むしろ table と考えて、専用の TEI タグ・セットを使うほうがよい。 リストはいくらでも入れ子にできる。 |
|
<list type=gloss> <label>EVIL</label> <item> <list type=simple> <item>I am cast upon a horrible desolate island, void of all hope of recovery.</item> <item>I am singled out and separated as it were from all the world to be miserable.</item> <item>I am divided from mankind &mdash; a solitaire; one banished from human society.</item> </list> <!-- end of first nested list --> </item> <label>GOOD</label> <item> <list type=simple> <item>But I am alive; and not drowned, as all my ship's company were.</item> <item>But I am singled out, too, from all the ship's crew, to be spared from death...</item> <item>But I am not starved, and perishing on a barren place, affording no sustenances....</item> </list><!-- end of second nested list --> </item> </list><!-- end of glossary list --> |
|
リストは、必ずしも改行しなくともよい。 |
|
On those remote pages it is written that animals are divided into <list rend="run-on"><item n='a'>those that belong to the Emperor,<item n='b'> embalmed ones, <item n='c'> those that are trained, <item n='d'> suckling pigs, <item n='e'> mermaids, <item n='f'> fabulous ones, <item n='g'> stray dogs, <item n='h'> those that are included in this classification, <item n='i'> those that tremble as if they were mad, <item n='j'> innumerable ones, <item n='k'> those drawn with a very fine camel's-hair brush, <item n='l'> others, <item n='m'> those that have just broken a flower vase, <item n='n'> those that resemble flies from a distance.</list> |
|
書誌的な項目のリストについては、 <listBibl> 要素を使う。(次節を参照。) |
|
/→文献/ |
13 書誌的引用研究目的の書誌的な引用は、テキストの印刷に際してきちんと分かるように区分けされるだろう。 <bibl> 要素は、書誌的引用部分を本文と区別する。 その他、次のタグを適宜利用するとよい。
編集注記のタグ付けの一例。(1)のカッコ内が注記の原文である。 |
(1) He was a member of Parliament for Warwickshire in 1445, and died March 14, 1470 (according to Kittredge, Harvard Studies 5. 88ff). (2) He was a member of Parliament for Warwickshire in 1445, and died March 14, 1470 (according to <bibl><author>Kittredge</author>, <title>Harvard Studies</title> <biblScope>5. 88ff</biblScope></bibl>). |
|
書誌的引用のリストには <listBibl> 要素を使う。これは <bibl> 要素の並びである。実例は、「22 リファレンス」中のリストを参照。) |
|
14 テーブル(表)テキスト処理システムにとってテーブル(表)は大きな課題だが、簡単な表は文章中によく現れるため、簡単なものであっても専用のタグが必要である。
次は、ダニエル・デフォーが黒死病年報中で使った死者の一覧表の例である。 |
|
<p>It was indeed coming on amain, for the burials that same week were in the next adjoining parishes thus:— <table rows=5 cols=4> <row role='data'> <cell role='label'>St. Leonard's, Shoreditch</cell> <cell>64</cell> <cell>84</cell> <cell>119</cell></row> <cell role='label'>St. Botolph's, Bishopsgate</row> <cell>65</cell> <cell>105</cell> <cell>116</cell></row> <cell role='label'>St. Giles's, Cripplegate</row> <cell>213</cell> <cell>421</cell> <cell>554</cell></row> </table> <p>This shutting up of houses was at first counted a very cruel and unchristian method, and the poor people so confined made bitter lamentations. ... </p> |
|
15 図と絵どんなに飾り気の無い文章でも、図解や挿し絵くらいは割合あるものだ。文書によっては文章と画像とが不可分なものもあり、他のメディアを駆使する電子的資料でもこれらがあるに越したことはない。 マークアップは、以下のタグによってテキスト中でのグラフィックのあり場所を記すだけでよく、あるいは内容を短く説明してもよい。数値化されたグラフィックを電子化テキストに埋め込む場合も同様である。
グラフィックに付属する言語情報は、ヘッダやキャプションのように、 <figure> 要素の中に <head> や <p> (必要な数ぶん)の形で含めてよい。 グラフィックの位置だけをマークした例。(要素内容が何も無い場合でも、終了タグは省略できない。) |
|
<pb n=412> <figure></figure> <pb n=413> |
|
グラフィックのタイトルは、 <head> 要素で示すことが多い。その際、短い説明も入れた方が便利だろう。 |
|
<figure> <head>Mr Fezziwig's Ball</head> <figdesc>A Cruikshank engraving showing Mr Fezziwig leading a group of revellers.</figdesc> </figure> |
|
数値化されたグラフィックデータを利用できる場合、文書中の適切な位置に埋め込めればなおよい。絵などは他のエンティティ(ファイル等)に分かれ、記法(フォーマット、ファイル形式)も異なっているのが普通である。 TEI Lite DTD では、 CGM , TIFF , JPEG 形式を、それぞれ cgm , tiff , jpeg という( SGML の)記法名で用いることができるが、他の記法であっても NOTATION 宣言をうまく DTD に加えるなら用いることは可能である。( SGML の NOTATION 宣言の詳細は、 TEI P3 の「 tables , formulae , and graphics 」の章、又は他の SGML 関連書を参照。) 画像がどんなフォーマットであっても、文章に埋め込む方法は変わらない。初めに、特定の型の SGML エンティティ(実体)−ファイル名のような外部識別子−と使われている記法とを宣言するのである。 |
|
<!ENTITY fezziPic SYSTEM "fezzi.tff" NDATA tiff> |
|
こうした宣言は、 SGML 文書そのものより先に読まれる。 TEI Lite DTD では、これらの宣言を litedecls.ent ファイル、又は公開識別子 -//TEI U5-1995//DTD TEI Lite 1.0 Extensions//EN を明示したファイルに置くことになる。 この宣言が働いているとき、数値データとしての画像を文書中の適切な場所に埋め込むためには、 <figure> 要素の entity 属性に値を入れるだけでよい。 |
|
<figure entity=fezziPic> <head>Mr Fezziwig's Ball</head> <figdesc>A Cruikshank engraving showing Mr Fezziwig leading a group of revellers.</figdesc> </figure> |
|
16 解釈・分析マークアップは解釈と分析の形式であるとはよくいわれるが、「主観的」情報と「客観的」情報とをいつでもきちんと区別するのは困難というよりほとんど不可能であるのに、「主観的」な判断が「客観的」な判断よりも論議を呼びがちであることには変わりがない。そこで、他のマークアップよりも異議を受けやすい点に読者の注意を促すことができる場合にのみ、その種の解釈をあえて記すという場合が多いのである。ここでは、こうしたマークアップのための要素をいくつか述べる。 |
|
正書法による文解釈というものは、他の構造単位にはかかわりなく、本文全体にわたるものだ。したがって、精密な解釈を行うには、本文を個々に分離独立した単位(文)に分けるのが有効で、それが「規範的な参照」の類のラベルとなるわけである。個々の単位は、互いに交叉したり入れ子にしたりしてはならない。次の要素で単位を表すと便利である。
名前が示すとおり、 <s> 要素は、句読法などの正書法による文を表すのに使える。はじめに引いた「ジェーン・エア」の例。 |
|
<pb n='474'> <div1 type=chapter n='38'> <p><s n=001>Reader, I married him.</s> <s n=002>A quiet wedding we had:</s> <s n=003>he and I, the parson and clerk, were alone present.</s> <s n=004>When we got back from church, I went into the kitchen of the manor-house, where Mary was cooking the dinner, and John cleaning the knives, and I said ‐</s> <p><q><s n=005>Mary, I have been married to Mr Rochester this morning.</s></q> ... |
|
<s> 要素は入れ子にはならないのだから、 <s> 要素の開始は直前の <s> 要素の終了を意味することになり、終了タグが不可欠なわけではない。また、この例のように区分する場合は、本文全体を端から端までタグ付けするのが望ましい。そうすれば、分析する文中の単語すべてが一つの <s> 要素に含まれ、唯一の参照関係を示すことができる。識別子が文書中で唯一のものならば、この例の n 属性よりも id 属性のほうがよいかもしれない。 |
|
汎用の解釈要素<s> 要素よりも汎用の分節要素としては、 <seg> 要素がこれまでも相互参照やハイパーテキストのリンク(「8」を参照。)のターゲットを特定するのに使われている。これは、いくぶん句レベルのまとまりを指し、唯一の識別子であるばかりでなく、ユーザー定義の type 属性を割り当てることもできた。したがって、これを TEI ガイドラインには何の定めもないテキストの特徴のタグ付けに用いることができる。 例えば、ガイドラインには、物語の語り手が読者(聴者)に向かって直接に語りかける部分をマーク付けするための <apostrophe> (頓呼法)の要素などは無い。このための1つの解決策としては、これを <q> 要素の一例として(ただし、 who 属性の値を適切に定めることによって区別することで)考えることであろうか。けれども、もっと簡単で用途の広い解決法は、 <seg> 要素を次のように利用することであろう。 |
|
<div1 type=chapter n='38'> <p><seg type='apostrophe'>Reader, I married him.</seg> A quiet wedding we had: ... |
|
<seg> 要素の type 属性は、およそどんな値もとりうるから、句レベルの現象なら何でも記録することができる。 <seg> 要素の値とその意味するところを TEI ヘッダに書いておくのがよい。
<seg> 要素は、見かけのよく似た <s> 要素とは異なり、同種又は異種の <seg> 要素の入れ子とする(ネストする)ことができる。このため、非常に複雑な構造を表現することが可能だ(「8 リンク属性」のいくつかの例を参照。) |
|
/→索引/ |
これに対して、 <interp> 要素には、どちらの制約も当てはまらない。この要素は、わりあいストレートな方法で、非常に複雑な解釈をマークアップできる頼もしい特徴を持っている。 |
これらの要素のおかげで、解釈の分類とそれに関する具体的事例とをマーク付けできる。 <seg> 要素ではあるものが頓呼であることしか分からないのに対して、 <interp> 要素を使えば、それがより上位の修辞的特徴に照らしてその具体的事例としての頓呼法であるということが伝えられるようになる。 その上、 <interp> は空要素であり、「8 リンク属性」で取りあげたana 属性によるか、この要素自身の <inst> 属性によって示した分節にリンクしなければならない。これはつまり、 SGML 文書の階層構造を顧慮せずにどのような分析も表すことができ、また特定のタイプの分析をグループ化することも容易になるわけだ。グループ化のためには、専用の <interpGrp> 要素がある。 具体的に、もしも主題・題材・修辞的特徴・物語の個々の場面の位置などといった文章の複雑な位相をマーク付けしたいとする。例えば、『ジェーン・エア』の離れた一節について、あるいは頓呼 (apostrophe) ・誇張 (hyperbole) ・隠喩 (metaphor) 等の修辞的特徴として、あるいは教会・召使・料理・郵便・ハネムーン等々の題材への参照として、そして教会の場面・台所の場面・居間(?)かどこかの場面等として、いろいろの意味づけを与えることになるかもしれない。こうした解釈は、 <text> 要素のどこにでも入れられる。しかし、それらは同じ場所に入れるのがよい。(例えば、前文や後付け等。)その例: |
|
<back> <div1 type='Interpretations'> <interp id='fig-apos' resp='LB, MSM' type='figure of speech' value='apostrophe'> <interp id='fig-hyp' resp='LB, MSM' type='figure of speech' value='hyperbole'> <!-- ... --> <interp id='set-church' resp='LB, MSM' type='setting' value='church'> <!-- ... --> <interp id='ref-church' resp='LB, MSM' type='reference' value='church'> <interp id='ref-serv' resp='LB, MSM' type='reference' value='servants'> <!-- ... --> </p></div> |
|
このコーディングの明らかな冗漫さを軽減するには、共通した属性値をもつ <interp> 要素を全部、 <interpGrp> 要素によってまとめればよい。 |
|
<back> <div1 type='Interpretations'> <interpGrp type='figure of speech' resp='LB, MSM'> <interp id='fig-apos' value='apostrophe'> <interp id='fig-hyp' value='hyperbole'> <interp id='fig-meta' value='metaphor'> <!-- ... --> </interpGrp> <interpGrp type='scene-setting' resp='LB, MSM'> <interp id='set-church' value='church'> <interp id='set-kitch' value='kitchen'> <interp id='set-unspec' value='unspecified'> <!-- ... --> </interpGrp> <interpGrp type='reference' resp='LB, MSM'> <interp id='ref-church' value='church'> <interp id='ref-serv' value='servants'> <interp id='ref-cook' value='cooking'> <!-- ... --> </interpGrp> </p></div> |
|
これらの解釈要素が定まったら、それを本文の該当部分にリンクさせるには、2つの方法がある(どちらか一方だけでも、両方でもよい)。 |
|
<div1 type=chapter n='38'> <p id='P38.1' ana='set-church set-kitch'> <s id=P38.1.1 ana='fig-apos'>Reader, I married him.</s>... |
|
A <interp> 要素に inst 属性を与えることによって、本文のどんな部分をも指示することができる。 |
|
<interp id='fig-apos' type='figure of speech' resp='LB, MSM' value='apostrophe' inst='P38.1.1'> <!-- ... --> <interp id='set-church' type='scene-setting' value='church' inst='P38.1' resp='LB, MSM'> <interp id='set-kitchen' type='scene-setting' value='kitchen' inst='P38.1' resp='LB, MSM'> <!-- ... --> |
|
<interp> は、特定の分野に限らない。以上のような文学的な分野は1つの可能性にすぎない。同様に、文法的な品詞を示すのにも十分使える。「8 リンク属性」で挙げた例文は、次のように分析することもできる。 |
|
<interp id=NP1 type=pos value='noun phrase, singular'> <interp id=VV1 type=pos value='inflected verb, present-tense singular'> ... |
|
17 技術文書本書の中心は、「電子化以前」の既存文書をマーク付けする TEI の方式を述べることにあるが、新規の文書についても同じ方式が当てはまる。 SGML では、文書構造を明確に表すことや、同じ文書をさまざまな目的に応じて再利用できるようにすること(オンラインのハイパー・テキストやブラウズ可能な文書も活版の体裁にまとまった文書も、共通の SGML 文書から生成できること)などを勧告している。 このことを容易にするために、 TEI DTD の拡張として技術文書全般と特に SGML 関連の文書の特徴をマーク付けする専用の要素を TEI Lite はいくらか含んでいる。 技術文書用の追加要素次の要素は、技術文書の特徴をマーク付けするのに使う。
|
|
Fortran 言語の入門書の一節をマーク付けするのにこれらの要素を使った例。 |
|
<p>It is traditional to introduce a language with a program like the following: <eg> CHAR*12 GRTG GRTG = 'HELLO WORLD' PRINT *, GRTG END </eg></p> <p>This simple example first declares a variable <ident>GRTG</ident>, in the line <code>CHAR*12 GRTG</code>, which identifies <ident>GRTG</ident> as consisting of 12 bytes of type <kw>CHAR</kw>. To this variable, the value <mentioned>HELLO WORLD</mentioned> is then assigned. This is followed by a <kw>PRINT</kw> statement and an <kw>END</kw> statement. |
|
このようにタグ付けすることにより、テキストをフォーマットするアプリケーションは、適切に働く。(改行を保持する、フォントを区別する、等。)同様に、 <ident> や <kw> などのタグを使えば、便利な索引を作るのもずいぶん楽になる。
<formula> 要素は、本文とは区別された数式や化学式を取り込むために使うべきだ。公式は通常の本文には表れない特別な字体を使うのが普通なので、特殊な記法で表現する必要がある。使用する記法は notation 属性で示す。 |
|
<formula notation=tex> \(E = mc^{2}\) </formula> |
|
SGML 対応プロセッサの場合、 <formula> 要素の中ではほとんどの文字が使える。データはパーサによって整形されることなく、その記法に連関するアプリケーションに渡される。唯一の例外は、 SGML 終了タグの開始文字( < )にすぐ続けて斜線( / )とアルファベットが来るとそれをパーサが認識してしまうことである。次のような架空の例では、 SGML 構文エラーが出てしまう。 |
|
<formula notation=tex> \(E = mc^{2}</a\) </formula> |
|
さいわい、数学的記法には実際に </ の並びが現れることはほとんどない。現れた場合の対処法は本書の範囲外である( P3 ガイドラインを参照)。 これは、それ自身が SGML で書かれた技術文書で SGML マーク付けをする際に問題になる。そういう文書では、例文中のマーク付けと文書そのもののマーク付けとをはっきりと区別せざるをえず、終了タグの現れる確率も高いからだ。最も一般的な解決法は、 SGML の例文をパーサの解析対象外データとして区別することである。次の例のように、 CDATA マーク済みセクション (CDATA marked section) という特別の SGML 構造の中に入れてしまうのである。 |
|
<p>A list should be encoded as follows: <eg><![ CDATA [ <list> <item>First item in the list</item> <item>Second item</item> </list> ]]> </eg> The <gi>list</gi> element consists of a series of <gi>item</gi> elements. |
|
この例では、 <list> 要素は、マーク済みセクション(特別なマークアップ宣言 <![ CDATA [ で始まり ]]> で終わる。)の中に埋め込まれているため、文書そのものの構成部分とは見なされない。 |
|
区分の生成現代的文書生産システムのほとんどは、内容一覧や索引を自動生成することができる。 TEI Lite の枠組みには、そのようにして生成されたセクションを置く場所をマーク付けする要素がある。
<divGen> 要素は、区分要素の入りうるところならどこにでも置くこと ができる。次の例では、生成された区分の種類を分けるための type 属性の使い方をも示している。最初の例が目次で2番目が索引である。 |
|
<front> <titlePage> ... </titlePage> <divGen type=toc> <div type='Preface'><head>Preface</head> ... </div> </front> <body> ... </body> <back> <div1><head>Appendix</head> ... </div1> <divGen type=index n='Index'> </back> |
|
もしも既存の索引・目次を生成するのではなくマーク付けする場合には、「12 リスト」 で触れた <list> 要素を使うべきである。 |
|
/→後付/ |
索引の生成正しくタグ付けられた文書から目次を生成することは何ら問題なく自動処理できるのが普通だが、良質の索引を作るにはより注意深いタグ付けが必要だ。特定のやり方でタグ付けられたすべての個所を単に索引項目とするだけでは不十分である。しかし、例えば <term> 要素や <name> 要素でマークした個所を残らず拾い上げるならば、かなり索引らしいものになってくる。 TEI DTD には、索引とする語句と索引作成の方法とを同時にマーク付けできる <index> という特別なタグがある。
例えば、この節の第2段落は次のようになる。 |
... TEI lite also provides a special purpose <gi>index</gi> tag <index level1='indexing'> <index level1='index (tag)' level2='use in index generation'> which may be used ... |
|
<index> 要素は、解釈・分析のタグにもなる。例えば、オビディウスの比較文体論的な研究をするためには、人物ごとの詩人の言及すべてを記録することが求められるかもしれない。『メタモルフォーゼ』の中の以下の行では、ジュピター( deus 及び confiteor の主題として)や雄牛の形をしたジュピター( imago tauri fallacis 及び teneo の主題として)その他への言及を記録することになる。 この分析は近刊の Willard McCarty, Burton Wright: An Analytical Onomasuticon to the Metamorphoses of Ovid, Princeton University Press) より許可を得て抜粋したものだ。 索引では、ある種の単純化が施されている。 |
|
<l n=3.001>iamque deus posita fallacis imagine tauri <l n=3.002>se confessus erat Dictaeaque rura tenebat |
|
注釈の必要は、「7 注記」で論じた <note> 要素、あるいは「16 解釈・分析」で扱った <interp> 要素を使うことで対処できるかもしれない。ここでは、さらに <index> 要素を使うことによっても満たせることを明らかにしておこう。 このオブジェクトが複数の索引を生成するとしよう。1つは神の名( dn : names of deities )、2つ目は語源学的参照( on : onomastic references )、3つ目は代名詞的参照( pr : pronominal references )その他といったように。索引は、たとえばこんな風になるだろう。 |
|
<l n=3.001>iamque deus posita fallacis imagine tauri <index index="dn" level1="Iuppiter" level2="deus"> <index index="on" level1="Iuppiter (taurus)" level2="imago tauri fallacis"></l> <l n=3.002>se confessus erat Dictaeaque rura tenebat <index index="pr" level1="Iuppiter" level2="se"> <index index="v" level1="Iuppiter" level2="confiteor (v227)"> <index index="mons" level1="Dicte" level2="rura Dictaea"> <index index="regio" level1="Creta" level2="rura Dictaea"> <index index="v" level1="Iuppiter (taurus)" level2="teneo (v9)"></l> |
|
これで見れば、個々の <index> 要素の中で level1 属性の値を見出し語にとることによって適切な索引が生成される。そして、 level2 属性のキーワードには主格の形で引用された単語が並ぶ。実際の参照は、 <index> 要素の出現する個所で索引にとられる。ここでいえば、 <index> を含む <l> 要素の識別子がそれである。 |
|
18 文字コード、発音(アクセント)記号、その他
ヨーロッパ諸言語を使用する者にとって、文字コードの使用に関する TEI 勧告は単純なものである。ローカルに使う限り、自分の機械なりソフトなりのサポートする文字コードを使えばよい。もし特殊文字を打つキーが不足したら、自己流にキーボードをカスタマイズすればよい(例えば、アクセント文字を表すために、適当なアクセントキーを文字キーの直後に打つ。あるいは、 aE で ä を表すというように、通常の文章には現れそうもない文字の組み合わせを使って打つ等)。こうして使った文字はあとで一括置換によって正しい文字に改めることができる。 異なるシステム間でファイルを交換するには、電子的な交換に際してもほとんど変わることのない次の文字のほかは SGML の実体参照 (entitiy references) を使って置き換えればよい。 |
|
a b c d e f g h i j k l m n o p q r s t u v w x y z A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 0 1 2 3 4 5 6 7 8 9 " % & ' ( ) * + , - . / : ; < = > ? _ (space) |
|
このリストからは、次の文字を除いてある。これらの文字は、国境や標準を越えた広範なネットワークにおいては実によく文字化けを起こしてユーザを苛立たせるものなのだ。ちょっと手元の Mac から PC 機にデータを転送するくらいなら、まず大丈夫だ。 |
|
! # $ [ \ ] ^ ` { } | ~ |
|
企業間のネットワークで正常なデータ転送を確保するため、アクセント文字や拡張ラテン文字、非ラテン文字、従来のキーボードにないシンボル文字などはすべて実体参照を用いて表現しなければならない。 標準的な SGML 実体宣言を行えば、 TEI 準拠の文書ファイルに独自の SGML 実体名を使うことができる。しかし、標準的な名前は冗長でも明確さの点で優れているので、表そうとする文字は英語を話す者なら十分理解でき、何ら特別なリストを使わなくとも参照されている実体文字がわかるはずだ。この点は、他の文法でアクセント文字を表す場合には当てはまらない。 上に掲げた文字が「文字化けする」ために使う実体名、西欧の主要言語のアクセント文字用の実体名等を次のリストに挙げる。 SGML 関連の仕事では公開実体文字セットとその内容一覧を使う。後述の名前は、 ISO に定めた公開実体文字セットに基づいたもので、広く使われており推奨できるものだ。 必要な文字がこの中にない場合、これと同じく、 ISO 公開実体文字セットで採られているのと同じ命名法を使って文字実体を生成してよい。
|
|
/→見出し/ |
19 前文・後付前文昔の本にはよく、扉・前置きとしての書簡などがあって、本文以外に言語・社会面の知識を提供していた。 TEI P3 ガイドラインには、前文に決まって現れるテキスト要素を区別する方法が出てくるが、ここにそれを手短にまとめる。 |
【扉】書物の扉は、 <titlePage> 要素で示す。この中の文章を、以下からふさわしい要素でマーク付けする。
活字の区別が必要な場合、前述のように rend 属性を用いる。ただし、装飾題の字間スペースや字のサイズなどあまり細かい点までは、まだガイドラインに定めていない。言語の種別は、 lang 属性または <foreign> 要素を適宜使う。名前は、ここでも <name> 要素を用いてタグ付けする。 扉をタグ付けした2つの例: |
|
<titlePage rend=Roman> <docTitle><titlePart type=main> PARADISE REGAIN'D. A POEM In IV <hi>BOOKS</hi>. </titlePart> <titlePart> To which is added <title>SAMSON AGONISTES</title>. </titlePart> </docTitle> <byLine>The Author <docAuthor>JOHN MILTON</docAuthor></byline> <docImprint><name>LONDON</name>, Printed by <name>J.M.</name> for <name>John Starkey</name> at the <name>Mitre</name> in <name>Fleetstreet</name>, near <name>Temple-Bar.</name> </docImprint> <docDate>MDCLXXI</docDate> </titlePage> |
|
【前文】前文の主なテキスト・ブロックは、 <div> 要素や <div1> でマーク付けする。次に挙げるのは、 type 属性の値だが、これによって前文に共通したさまざまなタイプを区別することができる。
他のテキスト部分と同じく、前文ではこれらは構造的な要素は無いか、あってもその役割は小さい。普通、 head 要素で括られるある種の見出し・題名で始まる。書簡の場合は、次の付加要素を含む。
本文の各所に置かれる書簡も、もちろん同じ要素を持つ。 ミルトンの『コーマス』劈頭の献辞をタグ付けした例を示す。 |
|
<div type='dedication'> <head>To the Right Honourable <name>JOHN Lord Viscount BRACLY</name>, Son and Heir apparent to the Earl of Bridgewater, &amp;c.</head> <salute>MY LORD,</salute> <p>THis <hi>Poem</hi>, which receiv'd its first occasion of Birth from your Self, and others of your Noble Family .... and as in this representation your attendant <name>Thyrsis</name>, so now in all reall expression <closer> <salute>Your faithfull, and most humble servant</salute> <signed><name>H. LAWES.</name></signed> </closer> </div> |
|
後付【後付の構成区分】出版の実際はさまざまであり、後付は前文の項で挙げたほとんどすべての要素を含む。加えて、後付は以下に示すものを <back> 要素に含めてよい。これらは本文の構成区分同様に、 <div> 要素または <div1> 要素としてタグ付けし、 type 属性によって区別するのがよい。
|
|
/→構造/ |
20 TEI ヘッダ活版の扉にあるような情報構造の分析は、 TEI 準拠のテキストではヘッダの中に記述する。ヘッダは、 <teiHeader> 要素で始まり、4つの主要部分から成る。
コーパスや類聚本は、作品各個の特徴があり、コーパス全体のヘッダと個々の作品のヘッダがあってよい。この時、ヘッダのタイプは type 属性で表す。次の例は、コーパス・レベルのヘッダである。 |
<teiHeader type=corpus> |
|
ヘッダの要素には、一つ以上の <p> 要素から成るものもあれば、次のようにグループ化されるものもある。
|
|
ファイル情報<fileDesc> 要素は必須である。次の要素を使って文書ファイルの書誌的記述をまとめる。
最も簡単なヘッダの構造: |
|
<teiHeader> <fileDesc> <titleStmt> ... </titleStmt> <publicationStmt> ... <publicationStmt> <sourceDesc> ... <sourceDesc> </fileDesc> </teiHeader> |
|
【標題】<titleStmt> 要素には、次の要素が使える。
次のように、標題はコンピュータのファイルと原文とで区別するのが望ましい。 |
|
[title of source]: a machine readable transcription [title of source]: electronic edition A machine readable version of: [title of source] |
|
<respStmt> 要素は、次の副要素を含む。(次例を参照。)
|
|
<titleStmt> <title>Two stories by Edgar Allen Poe: a machine readable transcription</title> <author>Poe, Edgar Allen (1809-1849) <respStmt><resp>compiled by</resp> <name>James D. Benson</name></respStmt> </titleStmt> |
|
【版歴】<editionStmt> 要素は、書誌の中で <edition> 要素が使われている時、版ごとの情報をまとめる。以下の要素が含まれる。
具体例: |
|
<editionStmt> <edition n=U2>Third draft, substantially revised <date>1987</date> </edition> </editionStmt> |
|
電子テキストの版をどう決めるかは、マーク付け担当者に任される。 【サイズ】<extent> 要素は、ファイルのサイズを示す。 |
|
<extent>4532 bytes</extent> |
|
【出版】<publicationStmt> 要素は必須である。以下のような記述または要素グループが含まれる。
出版の記載が説明的に書かれている場合以外は、この3要素のどれかを使う。そこには、次の要素が現れる。
|
|
<publicationStmt> <publisher>Oxford University Press</publisher> <pubPlace>Oxford</pubPlace> <date>1989</date> <idno type=ISBN> 0-19-254705-5</idno> <availability>Copyright 1989, Oxford University Press</availability> </publicationStmt> |
|
【叢書・覚書】<seriesStmt> 要素は、出版物が叢書にある場合、その情報をまとめる。 <title> 要素、 <idno> 要素、 <respStmt> 要素が入る。 <notesStmt> 要素を使う場合、注記・注釈を含む <note> 要素が含まれる。伝統的な参考書誌での注釈領域については、 TEI の枠組みで専用の要素を割り当てている。 |
|
【典拠】<sourceDesc> 要素は、コンピュータ・ファイルの元になった原典の詳細を記録する必須の要素である。ただの説明であったり、書誌的な引用だったりするが、その際次の要素を使う。
具体例: |
|
<sourceDesc> <bibl>The first folio of Shakespeare, prepared by Charlton Hinman (The Norton Facsimile, 1968)</bibl> </sourceDesc> |
|
マークアップ情報<encodingDesc> (encoding description) 要素は、テキストの写し全体に及ぶ方法と編集規則を表す。このタグの使用を TEI では推奨している。ここには、テキストまたは下記の要素が含まれる。
|
|
【目的・選定方針】<projectDesc> 要素と <samplingDecl> 要素の例。 |
|
<encodingDesc> <projectDesc>Texts collected for use in the Claremont Shakespeare Clinic, June 1990. </projectDesc> </encodingDesc> <encodingDesc> <samplingDecl>Samples of 2000 words taken from the beginning of the text </samplingDecl> </encodingDesc> |
|
【マークアップ宣言】<editorialDecl> 要素は、テキストをマーク付けする実例を表す。大概、以下の諸点にわたる。各々、段落を分けると便利である。
具体例: |
|
<editorialDecl> <p>The part of speech analysis applied throughout section 4 was added by hand and has not been checked. <p>Errors in transcription controlled by using the WordPerfect spelling checker. <p>All words converted to Modern American spelling using Webster's 9th Collegiate dictionary. <p>All quotation marks converted to entity references &odq; and &cdq;. </editorialDecl> |
|
【タグ・参照・分類コード】<tagsDecl> 要素は、テキスト中に用いられている SGML タグの情報を表す。単純な要素一覧なのだが、次の特別な要素を使う。
<rendition> 要素は、原文で要素の区別を表現する方法を表す。
具体例: |
|
<tagsDecl> <tagUsage gi=text occurs=1> <tagUsage gi=body occurs=1> <tagUsage gi=p occurs=12> <tagUsage gi=hi occurs=6> </tagsDecl> |
|
この(架空の)タグ宣言は、本文が12の段落を持っていて、中に6つの <hi> 要素がある場合のものである。 <tagsDecl> 要素を使う場合、関連するテキスト要素で本文に出てくるものすべてを <tagUsage> 要素で説明しなければならない。 <refsDecl> 要素は、タグ付けされた文書に標準的な参照方法を組み込む方法を説明する。最も簡単なのは、すべて文章で記すことである。具体例: |
|
<refsDecl> <p>The N attribute on each DIV1 and DIV2 contains the canonical reference for each such division in the form XX.yyy where XX is the book number in roman numeral and yyy is the section number in arabic. </refsDecl> |
|
<classDecl> 要素は、ヘッダの他の部分で使われている記述的な分類方法の定義・出所をまとめるものである。次の要素を用いて最低1つの分類法を示さなければならない。
最も簡単な例では、次のように書誌的参照によって分類体系を定義する。 |
|
<classDecl> <taxonomy id='LCSH'> <bibl>Library of Congress Subject Headings </bibl> </taxonomy> </classDecl> |
|
次に示すように、特別な目的の分類法を上の代わりに、または付け加えて、定義してもよい。 |
|
<taxonomy id=B> <bibl>Brown Corpus</bibl> <category id=B.A><catDesc>Press Reportage <category id=B.A1><catDesc>Daily</category> <category id=B.A2><catDesc>Sunday</category> <category id=B.A3><catDesc>National</category> <category id=B.A4><catDesc>Provincial</category> <category id=B.A5><catDesc>Political</category> <category id=B.A6><catDesc>Sports</category> ... </category> <category id=B.D><catDesc>Religion <category id=B.D1><catDesc>Books</category> <category id=B.D2><catDesc>Periodicals and tracts</category> </category> ... </taxonomy> |
|
こうした分類項目と特定のテキストとをリンクさせる方法については、 <textClass> 要素中の <catRef> 要素を使う(後述)。 |
|
文書情報<profileDesc> 要素は、テキストのさまざまな記述的側面を特徴づける情報を一つの枠組みで記録できるようにする。3つの付加的要素がある。
具体例: |
|
<creation> <date value='1992-08'>August 1992</date> <name type=place>Taos, New Mexico</name> </creation> |
|
/→分類/ |
<textClass> 要素は、 <classDecl> 要素によってあらかじめ定義された方式を参照してテキストを分類する。次の要素をいくつか含む。
<keywords> 要素は、テキストの性質や主題を表すキーワード・語句の一覧を含む。 scheme 属性により、これらを <taxonomy> 要素で定義された分類体系にリンクする。 |
<textClass> <keywords scheme=LCSH> <list> <item>English literature -- History and criticism -- Data processing.</item> <item>English literature -- History and criticism -- Theory etc.</item> <item>English language -- Style -- Data processing.</item> </list> </keywords> </textClass> |
|
更新履歴<revisionDesc> 要素は、テキストの更新記録(ログ)である。以下の要素を含む <change> 要素の並びをその内容とする。
具体例: |
|
<revisionDesc> <change><date>6/3/91:</date> <respStmt><name>EMB</name><resp>ed.</resp></respStmt> <item>File format updated</item> <change><date>5/25/90:</date> <respSmt><name>EMB</name><resp>ed.</resp> <item>Stuart's corrections entered</item> </revisionDesc> |
|
21 要素リスト共通属性TEI Lite の文書型定義( DTD )の要素は、どれも以下の共通属性を持っている。
|
|
TEI Lite の要素次のリストは、 TEI Lite DTD のための要素すべてに簡単な説明をつけたものである。
|
|
22 リファレンスこの付録には、 SGML と関連主題の書誌的参照リストを挙げている。「13 書誌的引用」で述べた <bibl> 要素の使い方を示す例にもなっている。 <listBibl> <bibl> ALA (American Library Association). <title>ALA-LC Romanization Tables: Transliteration Schemes for Non-Roman Scripts</title>, approved by the Library of Congress and the American Library Association, tables compiled and edited by Randall K. Barry. Washington: Library of Congress, 1991. </bibl> <bibl>ANSI (American National Standards Institute). <title>ANSI X3.4-1986. American National Standard for Information Systems --- Coded Character Sets --- 7-bit American National Standard Code for Information Interchange (7-bit ASCII).</title> [New York]: ANSI, 1986. </bibl> <bibl> <author>Barnard, David, et al.</author> <title level=a>SGML-Based Markup for Literary Texts.</title> <title>Computers and the Humanities</title> <biblScope>22 (1988): 265-76.</biblScope> </bibl> <bibl> <author>Barron, David</author> <title level=a>Why use SGML?</title> <title>Electronic Publishing Origination, Dissemination and Design</title> <biblScope>2.1 (April 1989): 3-24.</biblScope> </bibl> <bibl> <author>Coombs, James H., Allen H. Renear, and Steven J. DeRose.</author> <title level=a>Markup Systems and the Future of Scholarly Text Processing.</title> <title>Communications of the ACM</title> <biblScope>30.11 (November 1987): 933-947.</biblScope> </bibl> <bibl> <editor>Cover, Robin C., et al.</editor> <title>A Bibliography on Structured Text: Technical Report 90-281</title> <publisher>Queen's University,</publisher> <pubPlace>Kingston, Ont.</pubPlace> <date>June 1990</date> <note place=inline>A current version of this bibliography is maintained at <code>http://www.sil.org/sgml/sgml.html</code>. </bibl> <bibl> Goldfarb, Charles F., <title>The SGML Handbook.</title> Oxford: Clarendon Press, 1990. </bibl> <bibl> <author>van Herwijnen, Eric.</author> <title>Practical SGML.</title> <publisher>Kluwer Academic Publishers</publisher> <date>1990; 2d ed. 1994.</date> </bibl> (*邦訳『実践 SGML 』日本規格協会 1992) <bibl>ISO (International Organization for Standardization). <title>ISO 8859-1: 1987 (E). Information processing --- 8-bit Single-Byte Coded Graphic Character Sets --- Part 1: Latin Alphabet No.1.</title> (<title>Traitement de l'information --- Jeux de caracte ``res graphiques codés sur un seul octet --- Partie 1: Alphabet latin no1.</title>) First edition --- 1987-02-15. [Geneva]: International Organization for Standardization, 1987. </bibl> <bibl> ISO (International Organization for Standardization). <title>ISO 8879-1986 (E). Information processing --- Text and Office Systems --- Standard Generalized Markup Language (SGML).</title> First edition --- 1986-10-15. [Geneva]: International Organization for Standardization, 1986. </bibl> <bibl> ISO (International Organization for Standardization). <title>ISO 8879:1986 / A1:1988 (E). Information processing --- Text and Office Systems --- Standard Generalized Markup Language (SGML), Amendment 1.</title> Published 1988-07-01. [Geneva]: International Organization for Standardization, 1988. </bibl> <bibl> ISO (International Organization for Standardization). <title>ISO/TR 9573-1988(E). Information processing ---SGML support facilities---Techniques for using SGML. </title> Final text of 1988-09-12. </bibl> <bibl> ISO (International Organization for Standardization), and IEC(International Electrotechnical Commission). <title>ISO/IEC 10646-1:1993. Information technology --- Universal Multiple-Octet Coded Character Set (UCS) --- Part 1: Architecture and Basic Multilingual Plane. </title> [Geneva]: International Organization for Standardization, 1993. </bibl> <bibl>ISO (International Organization for Standardization), and IEC (International Electrotechnical Commission). <title>ISO/IEC 10744: 1992. Information Technology --- Hypermedia/Time-based Structuring Language (HyTime).</title> [Geneva]: International Organization for Standardization, 1992. </bibl> <bibl> Langendoen, D. Terence, and Gary F. Simons. <title level=a>A Rationale for the TEI Recommendations for Feature-Structure Markup. </title> <title>Computers and the Humanities</title> (1995; in press). </bibl> <bibl> <author>Warmer, J., and S. van Egmond</author> <title level=a>The implementation of the Amsterdam SGML parser.</title> <title>Electronic Publishing Origination, Dissemination and Design</title> <biblScope>2.2 (July 1989): 65-90.</biblScope> </bibl> </listBibl> |
|
|