[HOME]
   進行状況 (1)


98. 8. 29
  • 電子化テキストの記述について− TEI Lite のメモ

    ようやくメモがまとまった。これに関連して、 TEI J16 や CES ( Corpus Encoding Standard ) 等いろいろな領域での入門編もあるようだ。

  • このページへのリンク

    この拙いページもいくつかのホームページからリンクしていただいた。お世話になっています。(連絡を頂いたり、紹介されたりしたページを時間順・降順で掲載。)


98. 8. 26
  • 電子化テキストの記述について− TEI Lite のメモ

    テーブルを使ったので、表示が重たいものになっている。タグ一覧とリファレンスを除いて、ようやく本文のメモがまとまった。

  • HTML のタグ

    私のタグの付け方は相当いいかげんなものである。 SGML の本に加えてこの頃次のような本を読み、文章の構造と体裁を分けることが必要だとあらためて感じた。(この progress 自体は、変遷の記録なのであえて手直ししない。)

    • すみけんたろう 『スタイルシート Web デザイン − CSS2 完全解説』(技術評論社 1998.8.10)
    • ビレッジセンター HTML & SGML 研究チーム 『正しい HTML 4.0+ CSS1 −リファレンス&作法』(ビレッジセンター出版局 1998.3.20)

  • アクセス・カウンタ: above 200 (8.21)

    初めの 100 までに半年くらい、次の 100 が2ヶ月というわけでこのページなりにペースは上向きである。1度に六七ずつ一挙に上がる感じがするのは、固定客によるアクセスか自動巡回ダウンロードのためだろう。読まれているなら嬉しいのだけれど。


98. 8. 16
・電子化テキストの記述について− TEI Lite のメモ
ホームページの目次として当初挙げたものの中で「電子化テキスト」の項目が最後まで残っていたので、「とりあえず」 TEI の最も易しい(?)ガイドラインの抜き書きから手がけてみた。他は、項目は挙げていても、まだ暗中模索の状況である。なにぶん、定番・廉価のソフトの無いのが痛い。一太郎8 SGML を買う余裕もない。本来畑違いという自覚も働いて、どうもテキスト処理云々の話になると、否定詞ばかり並んでしまうことになる。
 しかし、 TEI のタグ付けは国語教員にも一応理解できる。最初のガイドラインも未完成ながら、早めにまとめていこうと思う。(誤りは、ご指摘頂ければ幸いです。)

98. 7. 23
・先哲叢談年表
年表本文がようやく出来上がる。ページ内リンクをつけようと思っているが、200KBを越える重たいページになりそうだ。索引も、年表に出てきた人名については作ってみた。なお、索引ができたついでにフレームを多少改善した。
・古典テキスト
前から少しずつ作ってはいるが、完成したものは少ない。国民図書版校註日本文学大系や校註国歌大系、群書類従本や有朋堂文庫版等をもとに入力している。また、国史大系版「十訓抄」も、表記・仮名遣い・句読点等を改め、ほんの少しだが語注をつける形で電子化を考えている。(実用的なテキストが必要だからだ。こういうものの扱いはどうなるのだろう。)これらも少しずつ Tj's Notebook ( Tj は宝島TJではない。念のため。)に出していこうかと思っている。
・教育とインターネット
〈教育研究〉でも、インターネットの活用はもはや目新しいテーマではなくなってきたのではないか。新奇さを追うばかりでなく、じっくりコンテンツの充実を期したい。自分の勉強もかねて文学史のネット学参でも作ってみようか、などと、多少の暇ができると考えをめぐらしているが、実行となるとなかなか時間がとれないのに困ってしまう。

98. 7. 8
・先哲叢談続編
紹介文を改訂。テキストの利用方法についても、ひと区切りついたところで少しずつ考えていかなくてはならない。
・ XML の本 (2)
  1. 川俣晶『 XML コンテンツの作り方』(東京電機大学出版局 1998.6.30)は、付属の CD-ROM に VNC.class ファイルが入っていなかったように見えるのだが(ついでに著者のウェブページにもその辺、何も書いていなかったようだが)、ともかく JavaScript と DynamicHTML とが XML に関連づけられていて面白かった。何となく"はやり"のものには手が出にくかったのだが、関心は出て来た。
  2. 雑誌特集も出始めた。「Computer Today」で SGML 周辺として前から連載しているもののほか、Sun 何とかの雑誌や「DDJ」(98.5,6)で〈第二特集〉くらいの紹介記事がぽつりぽつりと出て来ている。「Software Design」(98.8)でも特集するらしい。文系人間には縁のない雑誌ばかりだが、必要なものは読んでおこうと思う。

98. 7. 4
・先哲叢談続編
巻6をようやく追加。『続編』本文がとりあえず完成し、あとは年表を残すのみである。『先哲像伝』に続けていく。これまで1巻を加えるのに1〜2週間かかっている。このペースすら、かなり意識しないと保つのが難しい。古典作品でも、作っておきたいものはいくつかあるし、これまでのテキストや古典の主要作品について自分なりにダイジェスト版を作りたいのだが、まだまだ先の話である。

98. 6. 21
・先哲叢談続編
巻12をようやく追加。あと巻6・年表を残すのみである。『先哲像伝』に続けていく。TEIとXMLについても、徐々に取りかかってはいるが、暑さに負けてなかなか進まない。
・ささやかな記念
カウンタをつけるようになってから、ようやく100を越えた。実質は60くらいかと思うが、それでもまあ喜ばしいことである。

98. 6. 17
・画像へのリンクを修正
Netscape で画像が見られないという指摘を受けた。\を区切り文字にしていたためであることが分かり、修正した。この際、色名等もRGBの16進表示に切り換えた。今度は画像が見えるとのことである。

98. 6. 7
・フレームの手直し
リンクの辿り方によって入れ子になってしまう点、指摘もされ、自分でも気になっていたところを若干修正した。ついでに、色づかいも多少簡素化した。ようやく続編のインデックスもつけた。本文・年表は、もうしばらく時間がかかる。

98. 5. 31
・続先哲叢談
今月、巻3・4・10・11を付加。
・xmlの本
今月に入り、xmlの文法を詳細に解説した本が2冊続けて刊行された。
  1. XML/SGMLサロン『標準XML完全解説』(技術評論社 1998.5.15)
  2. リチャード・ライト『XMLを知る』(プレンティスホール 1998.6.1)
概略の紹介からようやく内容の検討に入ってきた感じである。現在、国民図書版「日本文学大系」などをもとに古典本文の入力もしかけているが、具体的なタグの付け方はまちまちである。これから工夫してみようと思う。

98. 5. 5
・続先哲叢談
ようやく巻3を付加。(現在、1・2・3・7・8巻の本文入力完了。)巻4、10もすぐにアップロードする予定。伊藤東涯『操觚字訣』など、あれこれ寄り道をしているため、相当間隔が空いてしまった。電子「古本やさん」のニュースを昨日見たが、自分の仕事は相変わらず続きそうである。
・sgmlのこと
自分にはやはり困難そうなSGMLだが、昨年から今年にかけて、アドビの FrameMaker Sgml(23万円)、一太郎8の sgml コンポーネント(4万円)などの製品が出ているらしい。遺忘に備えて書いておく。

98. 3.12
・続先哲叢談
ようやく巻2だけ付け加えることができた。(現在、1・2・7・8巻の本文入力完了。)外字はとりあえず『今昔文字鏡』により検字番号のみ入力してある。暇を見て更新したいが、教員は意外に忙しい。まず、本文入力だけでも進めようと思う。ATOK11 は、ずいぶん賢くなって、漢文や古文の入力も楽になった。VectorSoftwarePack の古文入力用辞書その他に助けられたところが多い。

・その他
今、同時並行的に行っていることを箇条書きにしておく。
  • 近世先哲叢談の入力。初めは、自分で書き下していた。今年に入って竹林貫一編『漢学者伝記集成』(名著刊行会)を発見。なあんだ!『先哲叢談』からはじめて全部出ているらしい。(先哲像伝を除く?)古典に無知なため、これまで無駄な労力を費してしまった。しかも、この本では体裁を統一してある。本文は、ほぼそのままと思われる。誤植も殆ど無いように見えた。良心的な感じの著作である。これも、今後照合するときの必須文献だろう。ただし、とりあえず続先哲叢談・近世先哲叢談については、やりかけたことでもあり、そもそも金港堂版先哲叢談で馴染んだ悪文?になるべく合わせて近世先哲叢談は書き下してきたので、まずは自分で書いてみて、「答え合わせ」に参照してみようかと思う。
  • 古典テキストや近現代の著書にいろいろなタグ付けを施している。こちらも遅々とした歩みである。
  • SGML周辺の読み囓り。自分が作ろうとしているのはどうせノートであるから、気ままに書き付けていくつもりで、これも少しずつ書いている。「Computer Today」誌で専門家による連載が始まったが、いろいろなソフトの画面図版が並んでいるのを見ると、羨ましいようである。ソフトウェアの価格は、数万円から数百万円まで、個人では及びもつかないものが現在はほとんどだ。もちろん、使い方など分かろうはずがない。書籍や記事に目を通すたびに、自分が何をやろうとしているのか分からなくなりかける。SGMLだけでも、終始雲をつかむようであるのに。

97.12.30
・先哲叢談(金港堂版)

 フレームを多少修正したが、リンクもさることながら、色づかいがうまくいかない。あいかわらず小中学生の学習参考書のように見える。
 外字について『大漢和』検字番号等の注記をほぼ終えた。(二三字の漏れはまだあるようだ。)前後篇の初稿として、利用できると思う。修正は、できるだけ早くするつもりである。外字の参照資料としては、現在では『今昔文字鏡』のように8万字以上を収めるCDも利用可能のようだが、誰にでもすぐに利用できる方法としては、まだ当分の間、大漢和参照方式が便利かと考える。この notebook のデータも、ささやかなものながら追々充実させていきたい。
 外字の補充が意外に手間取ったについては、これまで書誌関係はほとんど調べていなかったので、図書館で多少調べたりしたせいもある。(勤め人には、これが案外大変な作業なのだ。)そして、『先哲叢談』の前後編に加え、続編に当たる『續先哲叢談』や松村操著『近世先哲叢談』等を収めた影印本(『近世文芸者伝記叢書』ゆまに書房 昭63.8)を見つけた。該書は『續先哲叢談』については、「日本偉人言行資料」(国史研究会 大5)の複製を添えている。これには誤植が散見する。(自分も碌に推敲もしていないので、偉そうなことは言えないが。)手元の文学事典・歴史事典にはこれらの記載が実に少なく、互いのつながりはそれぞれの序で多少知る程度である。これらも電子化することにした。これらは、影印なのだが、これに語注を添え、とりあえず気づいた限りで誤植を訂正したため、本文は各々の原本とは異なるはずである。『近世先哲叢談』の方は、自分で書き下すつもりである。書き下しの誤りが大いに問題になってくるが、所詮は自分のノート(万年未定稿)であるという発想だから、極力注意はしながら入力を進めている。
 とりあえず、続編の序・巻1・7・8を掲載する。年表もまもなく載せる予定である。

・先哲叢談巻四を修正

 段落末尾の欠けているところがありましたので修正しました。(米川操軒の条)

・中古文学テキスト

 「和泉式部日記」「和泉式部集」「紫式部日記」「紫式部集」や「篁物語」など入力しただけのデータをとりあえず載せていたが、底本の著作権を侵害しているのではないかとの指摘をして下さった方があり、削除した。当初の目的通り、いずれ品詞データ等を完備した段階で再掲することにした。Under Constructionといった中途半端な自覚があり、そのままにしておいたのは良くなかったと思う。ただし、何度かファイルを書き直しているうち、どうまちがったか、リンクできない(もともと日本語のファイル名にしていたため)当初のファイルを上せたらしく、リンクをたどれなくなっているとのことであった。久々にわがページのリンクをたどってみたが、エラーが出た。幸いにも(?)著作権者の実質的被害は殆ど無かったのではないかと思う。ますます不体裁なページになってしまったが、徐々にましなものにしていこうと思う。

・電子テキストの形態

 ふとしたことから、SGMLについての入門書を読み漁っている。TEI、XMLなども、素人なりにこれからは知らなくてはならないことがあるように思われてきた。しかし、ちょっと素人には手が出しにくいレベルであるうえ、どうもオープンな印象を受けないのは自分のひが目なのだろうか。とりあえず、 TEI-P3 の CD があると聞き、窓口の千葉大(土屋俊氏)に往復はがきで照会したが、梨の礫であった。原文そのものはインターネットにあるし、DynaText Browser は Springer Verlag 刊行のガイドブックにも入っていたので No problem.ではあるが、気持ちのほうはすっきりとしない。それにしても、これからどうしようか。興味はあっても、よろず足らぬがちな有様である。
 とりあえず、こちらもネットで入手したガイドラインを読むことから始めようと思う。


97.10. 5
・先哲叢談(金港堂版)
漸く本文の入力を終わる。但し、外字の『大漢和』検字番号等の注記を殆ど全く行っていない。(修正版のアップロードまでにあと半月はかかるだろう。)厳密には校正をきちんとしなければならないが、その余裕は今のところない。底本の出来に加え、有朋堂版も確実な拠り所とは言えず、完璧を期せば際限のない面があるので、今のところはこの程度である。それにしても、前編397ページ、後編418ページ、それに序文凡例目次等を加えて800KBに満たない。(余分な記号・注釈を外せば更に100KB以上少くなるか。)デジカメの普通写真1枚にも遠く及ばないと思われるデータ量である。これの入力に半年近くかかっている。他のテキストデータもいろいろ作ったが、なんだかあっけない。まあ、それでもおかげで旧漢字に慣れたのはわずかな慰めというべきか。スキャナ入力より、たぶん勉強になる。
・先哲叢談の続編
これも書誌を調べ、今後増補していくつもりでいる。


97. 9.16
・先哲叢談(金港堂版)
後編完成までには今月一杯はかかる予定。
・前後編とも原文のルビには誤植や特有の読み方が目立ち、その都度「ママ」の表記や訂正等を行ってきたが、次の記事を読んでやや考え方を改めた。今さら注記の体裁を変えるわけにもいかないものの、参考までにここにその記事を引用したい。
 「南北」の語の読み仮名のつけ方でそれぞれ、自分が長年読んでいた読み方を主張してもめた。「ナンボク」だと言うものと「ナンポク」だと言うものがあり、上の字が「〜ン」のとき、下のハ行の音が濁音か半濁音になるかの問題であるが、両方並記することで解決した。だが、関東北部から北陸・東北地方は「ナンポク」、関東南部から中部地方以西は「ナンボク」と読む習慣があることをあとで知った。
 福島県出身の森忠清が言い出したこと――それは最初は何を言っているのかわからなかったが、よく聞いてみると『大漢和辞典』は熟語を五十音順に並べている、それについて、彼は「ア・イ・ウ・エ・オ」と「イ」と「エ」が離れて別になっていては混乱するだろうから、「ア・イ・エ・ウ・オ」と「イ」と「エ」をいっしょに置くのがよいと言った。つまり、彼は「イ」と「エ」とを区別して発音することができなかったからそう言ったのである。(原田種成『漢文のすゝめ―諸橋「大漢和」編纂秘話―』(〈新潮選書〉 新潮社 1992.9.15 pp.84-85)
漢文の返り点は大体の標準はあったが、細かいところには違いがあった。例えば、
	(A)欲捨之
(B)欲捨之
(C)吾将彼而不一レ吾力焉。
(D)吾将彼而不上レ吾力焉。
 これをどちらにするか協議したが、私が明治四十五年三月二十九日の官報に掲載された「漢文の句読・返点・添仮名・読方法」に従って、(A)に従うがよいとし、(C)(D)はそれに記載がないが、「上・下」「上・中・下」は「一・二・三」などをまたいで読むときに用いるものであるから、(C)を用いるのがよいと決めた。
 この官報に掲載されたものは当時の東京帝国大学教授服部宇之吉が委員長となって答申したものであったが、そこでは「添仮名」といっている。漢文の場合は「送仮名」ではなく、漢文を読むために必要な仮名を添えたものであって、語幹に対して語尾を送る送り仮名とは違うものである。例えば「」は「みずから」、「」は「おのずから」を示すために添えた仮名である。そのほか最後の一音を添えると便利な「故(も)・唯(た)・猶(な)」などのト・ダ・ホも送り仮名ではないのだから、添仮名というのが非常によい称呼であるが、この答申のほかには見たことがない。どうしたわけか惜しいことである。(同書 pp.112-113)
 ここに出てくる「イ・エ」の混用、「添仮名」の考え方などは、原書を転写している間、思い当たるところがあった。


97. 9. 2
・先哲叢談(金港堂版)
巻5の大漢和検字番号を補充。
・未完成のページへのリンクを外す。


97. 8.31
・先哲叢談(金港堂版)
後編巻四まで。8月中に後編まで完成しようと思ったのですが、あと1か月くらいかかりそうです。現在は、金港堂版の前編だけなら全文ダウンロードできます。後編は、巻四までの間でも現在まだ外字の整理ができていません。(実は、前編も巻5に少々、大漢和検字番号の脱落があります。これは大至急修正します。)また、有朋堂文庫版と東洋文庫版はこれからです。
・古典文学テキスト
テキストそのものはある程度入力が進んでいますが、自分の計画ではいずれは下記のような体裁にしたものを完成版としてここに出そうと考えています。現在刊行中のテキストについて入力したものは、これから出版社に了解を得ようかと考えているところです。
オリジナルテキストの体裁については、テキスト括弧書きの中に見出し表記を入れておけば、単語レベルの検索や計算に便利と考え、注記の書式を工夫したつもりですが、まだほとんど進んでいない有様です。
@非活用語(かな表記:品詞/*注記)
A活用語(終止形:品詞:活用の段・種類:活用形/*注記=敬語の種別等)

【例】
つれづれなる(ツレヅレナリ:形動:ナリ:体)まゝ(ママ:名)に(ニ:格助)、日くらし(ヒグラシ:副)、硯(スズリ:名)に(ニ:格助)むかひ(ムカフ:動:ハ四:用)て(テ:接助)、心(ココロ:名)に(ニ:格助)移りゆく(ウツリユク:動:カ四:体)よしなし事(ヨシナシゴト:名)を(ヲ:格助)、そこはかとなく(ソコハカトナシ:形:ク:用)書きつくれ(カキツク:動:カ下二:已)ば(バ:接助)、あやしう(アヤシ:形:シク:用)こそ(コソ:係助)ものぐるほしけれ(モノグルホシ:形:シク:已)。
なお、有朋堂文庫版や国民図書版日本文学全集その他、半世紀以前の古い版のテキストなら、そのまま載せても問題ないかと考え、徐々にこちらも作っていくつもりです。その場合は、現在図書館以外ではなかなか読めない作品が中心になることでしょう。


Progress の続き

Taiju's Profile

高校教員。森鴎外の史伝に興味を持つ。万年苦学生と自称。
筆記用具の延長としてコンピュータに興味を持ち、大学時代(昭和50年代前半)、PC6001mkUから始めてワープロソフトや遊びに熱中していた。ワープロもお絵かきも好きで、また「小さな」データベースという矛盾したものを作ったりもする。

【最新の Progress に戻る。】