[INDEX] [HOME]

index

TEI 紹介
 電子テキストセンター版(UVA TEI 試訳)

1998.9.27 現在、第2章まで(^^)
目次に番号をつけた。/(* )は訳注。


 (はしがき)
  1. 紹介
  2. 基本的なテキスト処理手順
  3. 実用的な TEI タグ・セット
    1. TEI ヘッダ
    2. 前文
    3. 後付
    4. 散文
    5. 韻文
    6. 戯曲
    7. 談話記録
    8. 実例画像ファイルに埋め込んだ SGML テキストを含む。)
  付録T 特殊文字   付録U ISO 639 言語コード   付録V UNIX におけるテキスト整形についての注   付録W 書き込み可能 CD-ROM 制作ガイド
  全 TEI タグのクイック・リスト
  ( TEI Lite サブセットへの参照を含む。)
  TEI Lite タグのリストと用法(ヘッダを除く。)   TEI Lite DTD (TEILITE.DTD, Version 1.4)   TEI ガイドライン

電子テキストセンターによる
  TEI 紹介と文書作成入門 (UVA TEI)

D. シーマン ( David Seaman )
ヴァージニア大学電子テキストセンター

1993-1995
UVA TEI: The Electronic Text Center Introduction to TEI
and Guide to Document Preparation
 
http://etext.lib.virginia.edu/tei/uvatei.html
別題(原題か):電子テキストセンターでの SGML テキストのマーク付けガイドライン
(Guidelines for SGML Text Mark-up at the Electronic Text Center)
…各章の見出しには、こちらの記載がある。

TEILITE 版 1995年春
OTA 版改訂 1994年春
初版 1993年春

[TOP]

ここにまとめた SGML のガイドラインは、テキスト・エンコーディング・イニシアチブ (TEI) によるテキスト作成をこれから始めようという人のための手引きとするため、初めはヴァージニア大学電子テキストセンター部内文書として著し、その後公開したものである。この草稿は TEILITE.DTD という TEI タグ・セットをもとにしている。(*変換後の HTML 文書には、TEI Lite タグの跡は見られない。)

本書の範囲はタグやその使い方だけでなく、電子テキストと関連画像の処理についての提案にも及ぶ。ここで取りあげるテキストは当然ながらすでに何らかの電子的形式になっているものである。OCR(* Optical Character Reader: 光学式文字読み取り装置) によるスキャンに関する情報は電子テキストセンター (*the Electronic Text Center; the Etext Center)の作成したウェブ文書資料群の中に見出すことができる。


[TOP]

1 紹介

ヴァージニア大学のオンライン電子テキストのコレクションは、どの本も標準汎用マーク付け言語(SGML)を用いてタグを施してある。 これは、テキストの構造的区分(扉・章・場・連、等)や印刷上の要素(活字面の変更・特殊文字、等)、その他テキストの特徴(文法的構造・挿絵の位置・異文、等)を記述するシステムである。

SGML のタグは、ASCII 文字データだけから成るので、特定のコンピュータ・プログラム専用のものではない。このため、例えば WordPerfect によって作成した文書のコードが WordPerfect プログラムに基づくもので、その中でしか意味を表さないのとはまったく異なっている。しかも、WordPerfect のコードではある語句をその外見(イタリック体など)によって定義するのに対し、SGML はもともとその語句の所属する情報の種類を記述するものである。イタリック体はさまざまの目的に使うものだが、SGML タグ・セットはたいてい、本の題名や章の見出しなどをもとに強調語句の働きを示すものなのである。

タグがこのようにテキストの構造を記録することにより、SGML 検索プログラムは特定要素の検索に絞り込むことが可能になる。小説で一つの章に絞って検索したくとも、テキストの中に章の区分を表すマークがなければ無理である。劇のある場に絞って引用句を見ようと思っても、場を区切っていなければ不可能なのだ。


章の題名がイタリック体で出てくる場合、次のようなタグ付けになるだろう。

  <div type="Chapter" n=1>
  <head rend="italics"> Chapter Name </head> 
  <p>[ここに章の本文がくる。]</p>
  </div> 
注意すべき特徴
  • 章は一組の「主要区分」(<div>)タグの中に囲まれている。すべてのタグの対の場合と同じく、終了タグは前傾したスラッシュ記号を含むことにで開始タグと区別される(</div>)。この例では、開始タグ <div> は区分のタイプと番号に関する情報をも含んでいる。
  • <head> タグは章の題名を囲んでいる。開始タグは、題名をイタリック体で表せという付加情報を含んでいる。
  • 章の本文は、段落(パラグラフ)を仕切るタグ(<p> </p>)の類に含まれることになる。

電子テキストセンターが使っているタグと処理方法は、人文科学のテキストのために SGML を実装したテキスト・エンコーディング・イニシアチブ(TEI)の一部である。我々はマイケル・スパーバーグ・マックウィーン(Michael Sperberg-McQueen)とルウ・バーナード(Lou Burnard)によって作られた TEILITE (*TEI Lite)という、 TEI タグを洗練、精選したサブ・セットに従っている。


センターの活動目的

電子テキストセンターの目標は、ヴァージニア大学を含めた人文学研究社会で広く認知された電子テキストの正確な本文を広く提供することである。我々が入手、作成したテキストは SGML によるマーク付けを経てオンライン・アーカイブの一部となる。法規上問題がない場合には、WWW(the World Wide Web) を通じてこのオンライン・テキストを公開し、非営利目的の利用に供している。ウェブを通して利用できるテキストは、ユーザの閲覧要求があった時に「TEI→HTML」コンバータを通る。つまり、変換が「飛ぶがごとく」起こることになる。テキストをダウンロードする前には必ず使用条件を見てほしい。

これらのテキストの正確度と完成度、および正確な書誌的記述には相当の注意を払っている。書物の挿絵や他の視覚的資料(例えば特殊コレクションからとった原稿ページなど)も可能な限り収めている。そのような方針は長期間の運用に堪えるテキスト資源を構築するために不可欠であり、研究者も一般読者も正確でかつ魅力的なテキストを求めている。また、ユーザ社会を形成すること、支援者の要求に適したトレーニング、説明資料、サポート体制等を整備することなどに努力すべき点も同じく重要である。


使用するソフトウェア

いうまでもなく、SGML テキストは「そのまま」読むために設計されたものではない。検索に際してはタグをデータベースの「フィールド」としてとらえ、結果を表示する際には印刷上の体裁を指示する一連の命令としてタグを解釈するようなソフトウェア・ツールを通して使うのが理想的だ。

我々がデータベースを索引化・検索するために現在使っているソフトウェアは、もともとオックスフォード英語辞典と共に使うためのツールだった「OpenText」検索エンジン(*カナダの OpenText社製 SGML ソフトウェア。UVa テキスト処理ソフトウェア〔訳〕も参照。)である。

このサーチエンジンは、ヴァージニア大学図書館(the UVa Library)に構築されたウェブ・インターフェイスを通して利用できる。ここで電子テキストセンター製「TEI→HTML」コンバータを使い、TEI テキストを「飛ばしながら」(*転送と同時に、の意。) HTML テキストに変換する。このおかげで TEI テキストを HTML 形式に改めた副本をサーバに保管しておく必要がなくなる。テキストは対象となる資料に適したタグ・セットで一度マーク付けするだけであり、なおかつウェブでアクセスすることも可能である。本学のオンライン蔵書中の中世英語と近代英語部門のテキストは、「TEI→HTML」変換過程を示した好例である。


[TOP]

2 ヴァージニア大学(UVa)における基本的なテキスト処理手順

次に、UVa 電子テキストセンターにおけるテキスト処理の手引きについて順を逐ってまとめる。電子テキストは活字本もしくは手書き原稿に基づくことを大前提としている。このことは、今日まで我々が処理してきたテキストの大半に当てはまる。ここに述べる手順の正確な詳細は UVa 固有のものもあるが、一般的過程と前提条件は他の場所でも容易に真似ることができるはずである。


  1. テキストが最初の検査を通過すると、今度は etext/to-do ディレクトリ(または to-do 内のディレクトリの一つ)に格納され、一つのパラメータを割り当てられる。to-do ディレクトリは処理を待っているテキストを保持する場所である。
  2. ファイルを etext/Done 中の適宜名前をつけたディレクトリに移動する。初めに、TEI ヘッダのテンプレート(header.etc)を付加し、完成に近い程度までテキスト情報を記入する。作業の際、現在行っていることを「更新履歴の記述」(<revisionDesc>)セクションにメモしておく。TEI ヘッダに関する注意を参照。
  3. テキスト独自の ID となる7文字の省略名を考え、これを <text> タグの id= 属性に補う。できれば、ID は著者名のうち3文字と題名のうち4文字とから成るようにするとよい。例えば、ジェーン・オースティン(Jane Austen)の「エマ(Emma)」は AusEmma というように作る。
  4. 電子テキストの原文をつきとめ、その本を手に入れる(必要なら図書館相互貸付[Inter-Library Loan] を使う)。この同定作業のため、テキスト制作者が分かれば連絡をとる必要がありうる。活版本は電子テキストをチェックするときにとても大切なものである。誤りのように見えても、実は活字本文の特徴だったりするもの(その顕著な例が英国流スペリングだ。)を「訂正」することはしたくない。
     もし、ファイルや関連資料に原文の記載がなかったり(オックスフォード・テキスト・アーカイブ [Oxford Text Archive ] の収蔵リストなど)、図書館の棚にある写しと比べてもそれ以上の情報が得られなかったりする場合には、このテキストの電子化を続けるべきかどうか決断する必要がある。
  5. 電子テキストの正確度をチェックする。例えば、Unix で認識できない単語がかなりあるかどうかを調べるために Unix のスペルチェック・プログラムを走らせたり、それがスキャンやタイプ時の誤りでないかをチェックしたりしてもよい。誤謬の目立つテキストは廃棄する必要もありうる。たとえ、タグ付きテキストのマーク付けが信頼できるものであっても、その内容まで信頼できると決めてかかってはならない。 TEI タグを適切に施したテキストはこの大学の近代英語と中世英語セクションにもあるが、それを処理すると何百もの誤記・誤植が出てくる [例1]|[例2]。
  6. 電子テキストの構造をチェックする。検索できる構造に対し、それを TEI タグで置換する(既存のワープロのコード、スペースのパターン、レイアウト、等)。もしテキストに何のマークも無い場合は、タグで置換可能な繰り返しパターンを探す(テキスト整形の注意を参照)。例えば、行の初めの5つのスペース記号が新しい段落(パラグラフ)の開始を示す場合、このパターンを検索し、</p><p> で置換することができる。テキスト中に <p> マークと5つのスペース記号の両方を残しておくことはしないこと。<p> はワープロのタブ命令のようなものと考えればよい。
     もしテキストに TEI 以外の既存のマーク付けが含まれていたら、それを置換する。例えば、イタリック体が一対の # マーク(それぞれ開始と終了)で区切られていたら、まず # を検索して <i>で置換し、次の # を見つけて </i> で置換するというルーチンを使って検索・置換を行うことができる。もしテキストがすでに SGML タグでマーク付けされていたら(今のところ、そういう例はごく少いが)、それを TEI のサブセットに変換する必要があるかもしれない。Unix の検索・置換ユーティリティである SED は、項目(イタリック体の語句など)がすべて1行に表れていないと使えないことを忘れてはならない。JoveEmacsWordPerfect のマクロを使うのが最も無難な選択であろう。
  7. 行末(とページ末)のハイフネーションの有無を探す。可能なら、はっきりした 行末ハイフネーションはハイフネーションを施した単語を検索する可能性を妨げるので閉じるべきである。
     「Elec-|tronic」ははっきり分かる。「word-|processor」は、1語とも、ハイフンを施した句とも、2語ともとれるのではっきり分からない。疑わしい場合は、行末のハイフネーション残しておく。
     はっきりした行末(又はページ末)のハイフネーションを取り去る場合には、語の後半部を前の行に移動して前半部に結合する。そうしたチェックの間、行や段落を誤って結合しないように注意する。
  8. 項目を見つけ、SGML コードで置換した場合、それは主要なテキスト区分(<div0> <div1> 等)を含んではならない。その場合には、手動で挿入しなければならない。主要区分の最初は <div0>、2番目が <div1> というようになることを忘れないように。タグ・セットの実用的入門を参照。
  9. 特殊文字を調べ、SGML 実体参照(*文字参照)に変換する(付録T 特殊文字を参照)。
  10. ページ付け。これはただテキストの見通しをよくし、引用の便を図るばかりでなく、少なくともページ・レベルでの相対的な完成度を確保するものである(短いページがあるのは、ある段落を無視してしまったためということもあるので注意すること)。ページのマーカーが全く無く、検索するものが何もない場合(例えば、2行の空白行や制御文字など)、これは手動で行わなければならない。本学には、ページ・マーカーを挿入し、電子テキストセンターでの蔵書番号を付加するマクロがある。
  11. 実用性を目指すなら、スペルチェックを行う。テキストが全般的に信頼できる電子版の原文に基づく場合は、全部のスペルチェックをすることは時間的な束縛にもつながるので必要ない場合がある。セクションをスペルチェックした後、確認のため、セクションを通読する。巨大なファイルは、時間がかかり過ぎるというだけの理由で、全部のスペルチェックができないこともある。ここでの操作は <teiHeader> に記録しておくこと。
  12. 各行末に1つのスペースがあることを確認する。「TEI→HTML」フィルタはハード・リターンのコードを保持しないので、スペースは必要であり、もし行末空白が全く無いと単語が混合してしまう。
  13. TEI ヘッダの情報を確かめる。
  14. 以上の段階の処理においてテキストが回復の見込みがないほど壊れてでもいない限り、検証と索引づくりの準備はできている。multidocs を走らせて、タグの形をチェックする。検証するには、sgmlssgmlregion を使う。すべてのチェックが終わったら、途中出来たすべての作業ファイルを削除し、出来上がったファイルは索引化のため etext/Done ディレクトリに移動する。

[TOP]

3 実用的な TEI タグ・セット

大規模の区分と小規模の要素

TEI ガイドラインは、2つの広義に定義された構造分類の間の区別を設けている。すなわち、主要な「構造区分」のマーカー(章など)とより小さな「要素」(段落、イタリック体語句、韻文の行、劇の個人の会話など)である。


主要構造区分

このカテゴリーはテキストの主要な区切り(巻・章・節・場など)を含み、<div> </div> タグの組で区別する。連(スタンザ)・段落(パラグラフ)・ページのような小規模の区分には <div> は使わない。

ここで用意したテキストはすべて、大規模な区分を表す同一の基本セットを使う。それぞれのテキストは、初めにその全部を一組のタグ(<TEI.2> </TEI.2>)で括るが、これはテキスト・エンコーディング・イニシアチブの規則に従ったものである。<TEI.2> タグの組は、<teiHeader> と <text> という2つの主要な部(セクション)を囲んでいる。<teiHeader> は活字原典、電子版制作者、我々の加えた変更等についての情報を記録する。

          <TEI.2>
              <teiHeader>
              [原文と処理に関する情報がここに来る。]
              </teiHeader>
              <text id=AusEmma>
              [「エマ」の一部となるすべての資料がここに来る。]
              </text>
          </TEI.2>

<text> の区切りの中で、作品は主要部分(セクション)に分かれる。テキストにはどれも <body> があり、この中にテキストの主要部分が見出せる。中でも、この配列の働きにより、 <teiHeader> の中のテキストを除外して、テキスト中の <body> の中にだけある項目を検索することが可能になる。

  <TEI.2> 
    <teiHeader> 
    [原文と処理に関する情報がここに来る。] 
    </teiHeader> 
    <text id=AusEmma> 
      <body>
      [テキストがここに来る。] 
      </body>
    </text> 
  </TEI.2>

<teiHeader> と <body> に加えて、他に2つの主要セクション(<front> と <back>)を持つテキストもある。前者は、前書きや目次のような前置きとなる事柄を囲み、後者は付録や索引などを区別するなどの使い方が典型的なものである。

  <TEI.2> 
    <teiHeader>
    [原文と処理に関する情報がここに来る。]
    </teiHeader>
    <text id=AusEmma>
      <front>
      [序文その他がここに来る。]
      </front>
      <body>
      [テキストの本体がここに来る。]
      </body>
      <back>
      [付録その他がここに来る。]
      </back>
    </text>
  </TEI.2>

【注意】 まれに、テキストは <body> でなく <group> でタグ付けすることを必要とすることがある。<group> タグは、特定の目的(例えば、短編物語の類話集)の単位と見なされる一続きの他と区別されたテキストをまとめるなど、複合的なテキストを囲む。この場合、テキストは各作品の集成という意味を保つため、<group> でタグ付けされるだろう。けれども、たいていの場合、このタグを使うことはない。

テキストの本文では、<div> は作品内の相互の階層的関係に基づいて連続的に番号を振る。我々の用法では、最も大きな構造区分は <div0> でタグ付けし、それに <div1>、<div2> その他のタグを続ける(TEI ガイドラインでは、<div> 構造に番号を振る初めは 0 ではなく 1 を使ってもよい。我々は <div> の最上位の要素として <div1> ではなく、あえて <div0> で始めているが、特に優れた理由があってのことではない。)例として、小説のある章はとかく <div0> でマーク付けされる最初の構造区分になることが多い。

  <TEI.2> 
    <teiHeader> 
    [原文と処理に関する情報がここに来る。] 
    </teiHeader> 
    <text id=AusEmma> 
      <body> 
        <div0> 第1章 </div0>
        <div0> 第2章 </div0>
        <div0> 第3章 </div0>
        <div0> 第4章 </div0>
      </body> 
    </text> 
  </TEI.2> 

章はどの作品でも初めから <div0> で番号づけするわけではない。もし複数の巻からなる小説だったら、章ではなく、巻が最大の内部構造区分となり、従って巻が <div0> 、章が <div1> となる。

  <TEI.2> 
    <teiHeader> 
    [原文と処理に関する情報がここに来る。] 
    </teiHeader> 
    <text id=xxxxxxx> 
      <body> 
        <div0> 第1巻はここから。以下、章が続く。
          <div1> 第1巻第1章 </div1> 
          <div1> 第1巻第2章 </div1> 
          <div1> 第1巻第3章 </div1> 
        </div0> 
        <div0> 第2巻はここから。以下、章が続く。
          <div1> 第2巻第1章 </div1> 
          <div1> 第2巻第2章 </div1> 
          <div1> 第1巻第3章 </div1> 
        </div0> 
      </body> 
    </text> 
  </TEI.2> 
タグに付けることのできる属性

タグはさらに「属性」を使うことによって拡張できる。属性は、開始タグの中に記述する成分である。ここに挙げたタグは、必要な場合、共通の属性をとることができる。

  • id= は、唯一を表す識別子である。数字ではなく文字で始める。名前に含めることができるのは、文字・数字・ピリオド・ハイフンだけである。id はその要素に唯一のものでなければならない。よく <note> と一緒に使って、<note target=> の値とリンクさせたりする。
    例: <note id="Note1" n=1>
  • n= は、要素に番号(や他のラベル)を与える。アルファベットまたは数字データを使うことができ、例えば n=1a や n=VIII はどちらも有効である。
    例: <div0 type="Chapter" n=1>
  • rend= は、その要素の印刷体裁をいかにするかを示す。
    例: <epigraph rend="bold">
  • lang= は、ISO 639に従った言語の略称を使って、タグ内の資料の言語を示す。
    例: <foreign lang="Fr">Zut Alors!</foreign>
    正式には、lang 属性は IDREF 型の属性であり、TEI ヘッダの <language> 要素の id 値を参照する。lang 属性が <language> 要素を指示するのは、TEI 方式では必須のことである。これはつまり、文書に使われている個々の言語は TEI ヘッダの中で <language> 要素を使ってあらかじめ宣言しておくべきことを意味している。
      <langUsage>
      <language id="Fr">French</language>
      </langUsage>
    

タグの中には、次のようにさらに属性を追加するものもある。

  • type= は、区分のタイプを記述する。
    例: <div1 type="Scene" n=1>

我々は、記述情報をダブル・コーテーション・マーク内の属性によって囲む。番号属性はただ一つ例外である。現在使用している検索・表示ソフトウェア OpenText は属性値を挟むシングル・コーテーション・マークを許していない。

属性とタイトルをつけた典型的な <div0> は、こんな感じになるだろう。

  <div0 type="Chapter" n=3> 
  <head> ヤマ場 </head> 
主要構造区分用の共通属性

次のものは散文用の代表的な単位であり、<div> タグ内で type= 属性により分けられる。

<div0 type="volume">
巻。複数の巻から成る作品の1巻。
<div0 type="book">
書。叙事詩・聖書等で一般に使われる書巻のまとまり。
<div0 type="part">
部。ノンフィクション作品で一般的な、書物より一段小さな区分。
<div0 type="chapter">
小説・短編物語(novella)での基本的構造区分。

要素

大きな単位でテキストの階層構造を表す構造的タグとは異なり、要素タグはテキストの個別的側面を表す。それは順番をつけた階層の一部ではない。普通の例では、印刷体裁の要素・標題・段落・行などをマーク付けするタグを含んでいる。要素タグの実例は、以下の節でまとめており、一段と拡張したリストはテキスト・エンコーディング・イニシアチブの『電子テキストのコーディングと交換流通のためのガイドライン』(Guidelines for Electronic Text Encoding and Interchange)で見ることができる。

印刷体裁の要素

印刷体裁を TEI 流にマーク付けする方法は以下の通りである。

  • <hi rend="italics">イタリック体</hi>
  • <hi rend="bold">ボールド体</hi>
  • <hi rend="smallcaps">小頭文字</hi>

印刷体裁のマーク付けを扱う際には、TEI ガイドラインを参照したうえ、ローカルな方法で変形する。

  • <i>イタリック体</i>
  • <b>ボールド体</b>
  • <sc>小頭文字</sc>
  • <sup>上付文字</sup>
  • <sub>下付文字</sub>

<i>,<b>,<sc>その他は、検証の前に自動的に省略しない形に変換される。

語法的強調

TEI では、<emph>タグを使うことで、語法的強調をただの活字面の変更とは別個のものとしてマーク付けできる。

  • <emph rend="italics">イタリック体</emph>
  • <emph rend="bold">ボールド体</emph>
  • <emph rend="smallcaps">小頭文字</emph>

具体例:

  <q><emph rend="italics">thousands</emph> of electronic texts.</q>
段落(パラグラフ)・リスト・行のまとまり
  • <p> </p>:段落(パラグラフ)
  • <page n=1> </page>:ページ [後述「空タグ」の<pb>タグについての注記を参照。]
  • <list> </list>は、リストとして組織された項目の並びを表す。
    • リスト内の個々の項目は<item>とタグ付けされる。属性 n= を伴うことがある。
  • <lg> </lg>は、スタンザやソネットのような行のまとまりを表す。(line groups)
    • グループ内の各行は<l>でタグ付けしなければならない。属性 n= を伴うことがある。
注記・注釈

学術的な作品には、マーク付けの必要な注釈を含むものが多い。できる限り、注釈の本文は以下のような形で表すのがよい。

  • -- 散文では、参照する主題を含む文の末尾に。
  • -- 韻文では、行かひと区切りの最後尾に。
<note>は、注記や注釈を含む。属性には以下のものが含まれる。
  • n= 注が本文に接続する位置をマーク付けするのに使う記号や番号。
  • type= 注釈に責任のある個人や団体。値の例には次のようなものがある。
    • au テキストの著者による注記。
    • ed テキストの編集者が加えた注記。
  • place= 原文で注記が現れる個所を示す。値の例には次のようなものがある。
    • f ページ下欄に現れる注記。(foot)
    • e 章や巻の最後に現れる注記。(end)
    • l 左マージンに現れる注記。(left margin)
    • r 右マージンに現れる注記。(right margin)

タグが文書中の他の場所へのポインタを含んでいることに注意。これは、原文が後注の形である場合、恐らく注記を処理するのに一番の早道である。本文内に注記を挿入するよりは間違いなく早い。次の例に出てくるが、target= と id= の値は同じものであることを確かめてほしい。前者が後者を指示する仕組みである。

本文中では
  <note target="n1.1.1m">
  carmina qui quondam studio florente peregi,</note>
テキストの他の場所では
  <note id="n1.1.1m">
  qui:(I) who. studio florente: ablative absolute; studium:
  here, eagerness, enthusiasm. peregi; perago, accomplish,
  complete.</note>
特殊文字

SGML システムは一定数の ASCII 文字によってテキストを表すので、この ASCII 文字種から外れる文字はどれも特別なタグで表さなければならない。特殊文字用タグはそれぞれ初めをアンパサンド(&)、終わりをセミコロン(;)で囲んだ短い説明語句でできている。上にグレーブ・アクセントのついた文字 a は &agrave; のようになるわけだ。ただし、アンパサンドは一つの特殊文字実体の始まりを示す文字でもあるため、この文字それ自体を表すには独自の文字実体(&amp;)が必要となる。

よく使う特殊文字実体をマーク付けするために、本学では <hi rend="italics"> を <i> と省略するのと同じようなわけでそれらについて文字実体参照の省略形を使うことにした。次にいくつかの例を示す。完全なリストは付録を参照のこと。

名前実体参照UVa による省略形
a acute&aacute;&aa;
a grave&agrave;&ag;
空タグ

タグは組になるのが普通である。しかし、単独で使われるマーカーもある(空タグと呼ばれる)。散文の改行を表す <lb> (line-break)はその好例である。

<pb> の注: TEI タグセットでは、改ページは空タグであり、<pb n=1> のように n= 属性をとることが多い。
[TOP]


     


[SECTION TOP]

●本文に戻る。

/←[1]/

[TOP]

[1]