研究者にとってのセルフアーカイビング
Self-Archiving: a Researcher's Perspective
高 木  元 ▼0 

概略 人文科学系基礎学の研究業績は、多くの場合経済的な見返りが期待できない。のみならず、短期間に個人で完璧な成果を挙げることの困難な課題が多い。したがって活字媒体での公表のみならず、インターネット上に webサイトを確保して、そこにアーカイブし公開することの意義は大変に大きい。著者自らが日々新たな知見や情報によって自らの記述の更新が可能だからである。しかし、一般に個人サイトの維持は有限である。千葉大学で始まった学術成果リボジトリは、書誌情報を添加して固定的なurlで持続的に保存されるという点で劃期的であるが、機械可読テキストの最大の長所である適時の更新、ないしは更新履歴の保存に対応していない点などの課題も残している。

キーワード 人文基礎学/研究成果公開/学術成果リボジトリ/著作権/GNU/GPL/GFDL

1 はじめに

1.1 人文科学系基礎学の危機

行政改革の掛け声の下、国家公務員の員数減らしに端を発した国立大学の独立行政法人化は、多くの慎重論があった中で敢えて強行実施され早一年余が経過した。さらに、蓋を開けてみれば中期計画の進行中に毎年経費が削減されていくという無茶苦茶な改革であった。この愚策蛮行と平行して、いわゆる実学重視を行政改革に於ける錦の御旗とした結果、実学偏重ムードを全国の大学に撒き散らした。

このような情勢の中で、人文科学系基礎学の軽視と、それを担ってきた文学部等に対する迫害は、東京都立大学の解体(人文学部潰し)や、国立大学法人の予算と定員との際限ない削減などを見る限り、最早許容限度を超えた事態に及んでいる。長年にわたって培われてきた人文科学系基礎学の伝統は、一旦そのシステムを破壊してしまったら、如何なる時間と経費を費やそうと、二度と復旧が困難になるであろう。とりわけ、数は少ないが確実に機能してきた基本的なスキルの伝承の場、具体的には、人文科学にとって不可欠な書誌学などを教育伝承する場が、存亡の危機に晒されている。とくに古典籍を中心とする書誌学は、国文学(日本文学)に拠って担われてきたといっても過言ではなく、その国文学を専攻する学科自体が虚学として日本の大学から排除されつつある▼1

さて、このような情勢の下で、情報に関わる諸学とりわけ図書館学は図書館情報学と名告りを改め、実学の装いを身に纏ってきた。が、出自を辿れば人文科学の根底を担ってきた必要且つ欠くべからざる学問領域であったはずである。いや、ことは人文科学系基礎学のみならず、主として理学部を中心として担われてきた自然科学系の基礎学でも事情は同様かもしれない。

1.2 図書館の問題

昨今、図書館の情報センター化が進んでいるようであるが、図書館は文字通り「図書」館としての機能を保持すべきである。図書資料という原物を蒐集整理し保存して閲覧に供するのが、図書館の基本的任務であろう。もちろん、所蔵資料の多元的な検索が可能になれば便宜には違いないが、飽くまでも現資料に辿り着くためのシステムのはずである。

また、貴重資料に関しては、資料の保全と閲覧という相矛盾する要素を孕む業務ではあるが、その解決策としてマイクロフィルム化が推進されてきた。しかし、ランダムなアクセスが出来ないなど、扱いやすさの点では決して満足できる状態ではなかった。近年、これらの資料がデジタル画像化されるように成ってきたが、デジタル化したことによってwebサイトでの公開が容易になった。概して所蔵館を代表するような貴重書から公開が開始されており、そのこと自体は歓迎すべきことであるが、その反面で現物の閲覧が困難になるのでは困る。如何に精緻な画像データでも、現物に付かなければ得られない情報を必要としている研究者には、整然と閲覧を保証する必要があるからである。

一方、陳腐化の激しい二次資料に関しては、電子ジャーナルなどの形式で利用に供することも時代の趨勢に見合っているのかもしれない。逐次刊行物は増え続ける点において、管理や経費の上で多くの問題を抱えていたからである。しかし、文学系の逐次刊行物に関しては、凝った装丁のものや、雑誌自体に趣向が凝らされたものもあり、やはり現物の保存が必要なものも少なくない。これらを区別なく電子化された情報として一元的に扱うならば、本来的に書物など物理的メディアの保存管理を任とする図書館の仕事として、見識を欠くといわざるを得ない。

ところで、大学図書館を覗くと、参考図書室の閲覧席では大勢の学生たちが電子辞書を机上に置いて勉強している。棚に整理して並べられている凝縮された知のデータベースとでもいうべき参考図書を開いている姿はあまり見られない‥‥。調べ物は取り敢えず電子辞書で、次には情報端末の前に座ってインターネットのサーチエンジンを使う。これでは、何時まで経っても、階層化されて整理されている辞典類を巧く使いこなせるようには成らない。知識情報を階層的に整理して検索可能にするというシステムは、謂わば世界の記述であり、それ自体が学問体系を暗喩しているといえる。つまり、ランダムな語彙レベルでの検索は、これらの体系を無化して平準なデータとして扱うことを意味し、そこには便宜はあっても学問体系は存在しない。

また、インターネット上の情報はS/N比が甚だ低いことは周知のことである。辞典など参考図書とは資料価値として比較にならないはずである。

1.3 問題のありか

実学偏重とは、行政改革に名を借りた経済至上主義であり、人文科学系学問の諸体系を破壊するものである。目先の要求に応える便宜は、手間暇が掛かる基礎学をないがしろにし、目に見える結果や成果だけを追求する。言い換えれば、体系を無視して平準化したデータだけの提供を求められているのである。これは図書館の情報センター化とも軌を一にしているだろう。

かつて、以後の研究に不可欠な知見に満ちた論文集を上梓された老先生に、「何故索引を付さなかったのですか」と訊ねたとき、「わたしの仕事は資料情報だけを提供するものではない。それを体系化しようと悪戦苦闘した足跡こそを見て欲しい。」と答えられた。なんと悠長なことかと思ったが、しかし今になってみれば一見識であったといえよう。基礎学はお手軽に情報が得られるだけでは進捗が危うい分野でもあるのだ。

そこで、人文科学系基礎学徒の一人として、現在直面している学問の危機と図書館の孕む問題に対し、個人の研究業績の公開流通という観点から述べてみたい。

2 研究業績の公開

2.1 機械可読テキスト

昨今、論文の執筆や資料情報の整理にはパーソナルコンピュータが使われるのが一般的であり、結果的に活字媒体として公開される前段階のデータは、機械可読テキストとして執筆者の手許に保持されるようになった。

一方、活字媒体で世に公にされた研究成果は業績として認知され、しかるべき文献目録やデータベースに登載されてそのプライオリティが確保される。このシステムは現在も強固に機能しているものと思われる。印刷された版面こそが、静的な情報、すなわち客観的普遍的に確認できるメディアとして認知されているのである▼2

つまり、ある時点から、その情報を欲する人のアクセス可能な存在となり、しかも第三者が手を加えることができないという事実が、その業績の固有性を保証していることになる。

尤も、実際はもう少し複雑なシステムを経ていて、一般的な学術雑誌の場合は、(依頼)投稿・受理・審査・掲載という手順を踏んで研究業績としての権威付けがなされる。したがって、ある研究成果を、権威付けの成されないメディア▼3(機械可読テキストとして)公表しても、現在のところは業績として認知されるのは困難であろう。つまり、物理的なモノ(活字媒体)として研究成果が公開されないと業績にはならないということを意味する。文献資料という物理的なモノを蒐集・保管・提供するという図書館業務の意義は、現時点においてはこの一点に存するわけである。

機械可読テキストと活字媒体との最大の差異は、複製が容易で検索や加工が可能である点に存する。この機械可読テキストの性質は、執筆段階における便宜を提供してくれているのみならず、再利用や更新にも大いに有用である。使い方にもよるが、正規表現▼4が使える環境であれば、かなり複雑なテキスト処理が可能であり、もちろん、必要に応じてxml化することも容易である。

さて、人文科学系基礎学にとって、精確な複製が容易で検索加工が可能であるという機械可読テキストの性質は、歓迎すべきものである。個人がなし得る研究の時間的物理的な限界は、時空を超えた大勢の協同性を得て、初めてより良い成果となるからである。そこでは、個人の業績などというケチな名誉意識は意味を持たない。もちろん、ある仕事に関わった人々の名は記憶し語り継がれるべきではあるが、それよりも、次代に残すべき研究成果をより精確なものにしたい、という情熱と労力に対する敬意があれば良いのである。この意味において、研究成果が機械可読テキストとして公開される意味は、決して少なくないはずである。

具体的には、書誌書目や年譜、未刊行資料集などを念頭においているが、活字媒体のみならず機械可読データとして公開されていれば、これらの研究の継承は格段に進捗するはずである。その上、昨今の国内における実学重視の施策で、近年隆興してきた海外での日本文学研究に継承者を期待するしか術はない。だとすれば、世界中からアクセス可能なインターネット上に、このような研究成果を公表しておくことも無意味ではなかろう。

ここで留意しなければならないのは、かつての私家版よろしくDTPで美しい活字媒体を作成して、身近な人に研究成果を配ったところで、時空を超えて必要な人の手には届かないということである▼5。出版は流通が整備されて初めて機能するものだからである。その意味ではインターネットは、共時性においてのみは流通の問題を解消してくれた。

2.2 学術リポジトリ

千葉大学における学術成果リボジトリ(CURATOR = Chiba University's Repository for Access to Outcomes from Research)▼6の構築▼7は、インターネットにおける情報公開の永続性を志向したものとして大変に魅力的である。

現在、個人が保有しているwebサイトは、ホスティングサービスを利用したものでも、自前でサーバを管理しているものでも、おそらく一代限りの有限なものでしかない。つまり、共時的な流通方法でしかないという限界を持っていたわけである。しかし、今後、学術成果リポジトリが機械可読テキストのアーカイビングを担って行くならば、持続的な公開流通に期待が持てる。

さて、実際に運用を始めてみて気が付いたのは、適時の更新に対応するシステムが用意されていないことである。資料情報は訂正や追加が不可欠であり、活字媒体ではリアルタイムでの更新は不可能であるが、webサイトではそれが容易である。細かい誤植の訂正はもちろんのこと、成稿後の調査や別の研究者からの教示による補訂などが、随時可能な点に大きなメリットが存する。しかし、現在の千葉大学におけるリポジトリのシステムでは、活字媒体に準じて、客観的に第三者が変更不可能な形での存在証明的な保存公開を志向しているため、適時の更新ができない。

この点は大きな問題である。おそらく資料情報においては、最新版こそが最も価値ある精確な情報だからである。全ての版を保存するという方法もあると思われるが、資源の無駄でもある。可能ならばRCS(Revision Control System)のように差分を取りながら、全ての版を復元可能な形で最新版を公開できると良いと思われる。機械可読テキストであれば技術的に問題はないが、PDF化されたものは厄介かも知れない。

また、提供した研究成果が公開されるまでのタイムラグも気になるところである。多くの業務の中の一つであるから、機敏な対応が困難であろうが、今後は、リポジトリ自体が、ある種の権威化を伴った研究成果発表のメディアとして機能する可能性があると思われるので、検討課題としていただければと思う。

3 著作権という桎梏

3.1 パブリックドメイン

最後に著作権の問題に触れておきたい。

人文科学系基礎学の研究成果は、およそ経済的な見返りとは縁のない世界である。宇多田ヒカルの楽曲と、幕末に読み捨てられた小冊子の書目▼8とでは、どちらに経済的な価値が存するかは自明である。また、自然科学系では特許の取得数が研究成果として数え上げられているようであるが、人文科学系基礎学には特許も無縁である。

ようするに、実学志向や著作権という発想自体が経済主義的な発想であり、およそ人文科学系基礎学には適合しない感覚なのである。にもかかわらず、研究成果を知的所有物として位置付け、著作権者の経済的権益を保護しようとするから間尺に合わないことになる。

人文科学系基礎学は、その研究成果をパブリックドメイン(著作権消滅状態)に置きたいと志向するものである。何時でも、誰でも、どこでも、無償で使える情報と成って、初めて活用され、さらに大勢の手によって、より精確な情報として後代に伝えられることが期待できるからである。しかし、困ったことに現行法では著作権者の死後50年を経なければ著作権は消滅しないのである。さらにこれを延期するという議論すら在るという。

著作権の一切を放棄することが可能ならば良いのであるが、著作人格権は放棄できないそうだ。ならば、自分の研究成果を、敢えて「読み人知らず」として、何れかのメディアに公開してしまえば良いのであるが、それでは資料自体の保守更新をする責任の所在が知れず、困ることになると思われる。まして、若い人文科学系基礎学徒にはプライオリティの保証ができなくなり、職に就くにも困ることになるであろう。

この問題に関しては、フリーソフトウエアの運動やオープンソフトの発想が大変に参考になる。

3.2 GFDLについて

著作権の一切を放棄できないならば、これを逆手に取って、著作権者が著作物の自由な利用と流通を宣言してしまおうというのが、GNU▼9プロジェクトの推進母体であるフリーソフトウエア財団(Free Software Foundation)の GNUフリー文書利用許諾契約書(GNU Free Documentation License)▼10である。

GFDLは、GNUプロジェクトで世に送り出されたフリーソフトウエアに添付されるドキュメントに付加されるために作成されたのであるが、一番重要なのはGPL(GNU General Public License▼11)と呼ばれるライセンス規定である。その特徴は、加工編集や再配布は誰でも自由に行えるが、再配布する者は、その複製と加工する自由をも継承しなければならないという点にある。これは、コピーレフト▼12とも呼ばれ、一度GPLが適用されたものは、二次著作物となってもGPLの下にあり続ける必要があるのである。しかし、これは商業利用を禁止しているわけではない。

筆者は活字媒体で公刊した著作物の大部分をwebで公開している▼13が、その際、各ドキュメントの末尾には必ず本稿末尾のように記している▼14

4 終わりに

人文科学系基礎学をめぐる状況と、その研究成果の発表に関する問題点を述べてきたが、基本的にはパブリックドメインにできれば理想的だと思われる。そのために、拙サイトでの公開に際しては敢えてGFDLに拠っている。筆者が現在サイトで公開しているコンテンツの持続的公開に関しては、学術リポジトリに期待が持てると思う。それは、非排他的な無償の使用権をリポジトリに譲渡しているから可能になることである。もし、他に、排他的な使用権を認めたり、著作権自体を譲渡してしまっては、リボジトリへの掲載が不可能になってしまう。

つまり、研究成果の作成者が著作権を保持して、排他的な使用権を決して第三者に容認しないことが、学術リポジトリを利用するに際しては、必要不可欠な条件となるのである。



0 千葉大学文学部、〒263-8522 千葉県千葉市稲毛区弥生町1-33、043-251-1111
1 中野三敏.読切講談 大学改革−文系基礎学の運命や如何に−.岩波ブックレットNO.449.1998年3月20日.ISBN4-00-003389-1
2 それゆえAdobe社の提唱するPDFのような仕様が不可欠になったものと思われる。
3 例えば私的に保有しているwebサイト。
4 Jeffrey E.F.Friedl著・歌代和正監訳「詳説 正規表現」オライリー・ジャパン / オーム社 1999 など参照。
5 古本市場における流通が補完してくれるという側面は小さくないのであるが、何時でも入手可能にはならないであろう。
6 CURATOR(accessed 2021-03-20)
7 尾城孝一,杉田茂樹,阿蘇品治夫,加藤晃一.「日本における学術機関リポジトリ構築の試み−千葉大学と国立情報学研究所の事例を中心として−.情報と科学と技術 Vol.54 2004
8 切附本書目年表 (accessed 2021-03-20)
9 GNUとはGnu's Not Unixの略であり、誰もがフリーに使えるよう作成されているUnixと完全互換のソフトウェア・システムの名称。
10 原本日本語訳(共にaccessed 2021-03-20)にある。
11 日本語訳はGNU一般公衆利用許諾契約書"(accessed 2021-03-20)
12 ルールが後々まで守られるために著作権(Copyright)を残す(left)ということからの呼び名。
13 ふみくら(accessed 2021-03-20)
14 つまり、本稿自体もGFDLに規定されているわけである。

Abstract In most cases, scholarly work in the humanities does not result in economic compensation. Furthermore, there are many subjects for which it is difficult to produce thorough results. There is thus a great significance and potential in making public the results of one's work not only through the medium of print but also by means of maintaining a website and creating a public archive on the internet. This allows the author him or herself to modify and update even on a daily basis their work by adding new information. There are, however, normally limits to maintaining a personal website. The institutional repository begun at Chiba University is in many ways truly revolutionary in that it allows for a continuous preservations of fixed URLs to which have been added bibliographic data. Two important problems, however, remain: the ability to cope in a timely manner with revisions and updates - which, after all, is the great advantage of electronic text - and the preservation of a history of updates.
Keywords the basic humanities/repository/copyright/GNU/GPL/GFDL


#「4. 研究者にとってのセルフアーカイビング」
#「情報の科学と技術」Vol.55 2005 No.10 (情報科学技術協会) 所収。
# Copyright (C) 2021 TAKAGI, Gen
# この文書を、フリーソフトウェア財団発行の GNUフリー文書利用許諾契約書ヴァー
# ジョン1.3(もしくはそれ以降)が定める条件の下で複製、頒布、あるいは改変する
# ことを許可する。変更不可部分、及び、表・裏表紙テキストは指定しない。この利
# 用許諾契約書の複製物は「GNU フリー文書利用許諾契約書」という章に含まれる。
#                      高木 元  tgen@fumikura.net
# Permission is granted to copy, distribute and/or modify this document under the terms of
# the GNU Free Documentation License, Version 1.3 or any later version published by the
# Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-
# Cover Texts.
# A copy of the license is included in the section entitled "GNU Free Documentation License".

Lists Page