「引用」の形式いくつか — TEI Liteの自習(1)
古典テキストを入力していくと、会話・心話等の引用箇所をどうタグ付けするかという問題に必ずぶつかる。(「書誌的引用」ならぬ「話」の引用である。)
会話についていえば、TEI Lite の方法は以下のようになる。引用は <q>…</q> であり、 <q type=spoken who=ID>…</q> のようになる。心話なら <q type=thought who=ID>…</q> だ。これが、直接会話の形態をとる散文・韻文・戯曲では、q ではなく、sp となる。(このあたり、quotation と speech の区別が直感的につかみづらい。文脈の解釈が挟まってくるのではないか。)<sp who=ID><speaker> NAME </speaker>…</sp> という具合である。ちなみに、TEI は SGML を基礎においているため、会話の連続が前後から明確ならば、終了タグは省略できる。また引用符は共通属性 rend を使うことで取り去ることもでき、その場合 <q rend=italic>…</q> (他に bold,gothic; blockquote,in-line 等)というように処理する。
しかし、日本語で「引用」を表す助詞「と」「とて」「など」等の守備範囲はなかなか広い。例えば噂・伝承・神託等の引用もある。これらは、 type=misc とするか、或いは「引用」を〈強調〉の一形式とする TEI の考え方に従って <hi rend=quoted>…</hi> とするか。who 属性は「人」とするか、「人々」とするか。伝承や神託では who= は書きづらい。ルールにしっくり当てはまらない例は他にもまだ出てきそうだ。引用形式にしただけで、敬語の据わりはかなりぎこちなくなってしまう。
なお、TEI Lite の引用タグには通称を表す <soCalled>…</soCalled>、前出語句の引用を表す <mentioned>…</mentioned> というのもある。ただし、これらをタグ付けして区別しなければならないのはどんな場合なのか、ちょっと見当がつかない。厳密な区別を求めるほどに、解釈の相違が浮き出てきそうな問題だ。その他、引用の断片の相互リンク <q id=A next=B>…</q> … <q id=B prev=A>…</q> というのもある。分析の肌理が細かい。
試行錯誤中の Taiju's 古典テキストでは、現在、自分一己の考えで千篇一律(実際にはまだ一編だけだが)に <sp atr="">…</sp> 又は <sp name="">…</sp> のタグを入れている(atr: attribute)。この属性値には、具体的人名(これ一つとっても〈統一〉することはけっこう難しい。)の他に「噂」「伝承」「神託」等の語句も放り込んでいる。厳密を期すためのシソーラスなんて皆無だ。他にどんな語句が必要になってくるだろうなどと考えながら入力しているので、厳密なタグ付け文書から見れば、一顧にも値しない電子テキストということになるかもしれない。なおまた、「…こと」「…由」などで終わる「引用」句の扱いなども、今後の課題である。でも、誰かがこういうことはとうに分析しているのでは? 御存知の方はご教示願います。
さらに、マーク付けの基本的方針として、原文の「体裁」を保存するのか、解釈の軌跡を示すのか、という課題がある。現在のわが「古典テキスト」ページは、自分の考えで引用符を挿入したり句読点を改変したりしている。これも、半ば以上自分の必要を満たすために作業しているためなので、公的なサービスとは根本的に性格が違うところではないか。