基于元数据提取实践的金石拓影数字化研究|宝鸭斋金石拓存

  摘要:全面揭示金石拓影的描述性、管理性和GIS元数据元素,拓影内容校读与参考文献利用相结合,成果比对与专家研讨相匹配,既重视元数据方案的提炼和完善,又强调持续不断的数字化实践,使得金石拓影数据库的推广应用,有利于拓影对象的数字传播,有利于拓影对象的后续创新研究,有利于拓影对象知识地图的建立,有利于拓影对象借助数字技术延续自身的物理寿命和拓展文献传播的文化空间。
  关键:拓影 元数据数字化
  拓影是指运用古老的传统捶拓技艺,使用宣纸和墨汁(或其他颜料),将碑文、墓碣、摩崖石刻以及器皿上的文字或图案,清晰地拷贝出来的一种文献,故又称金石拓片。随着数字图书馆的诞生、发展和普及,拓影数字化也成为近年来图书馆界关注的热点课题。国内拓影收藏有一定规模的图书馆相继进行了积极有益的探索和实践,并分别制定了拓片元数据标准或规范,如《北京大学古籍数字图书馆拓片元数据标准》、《国家图书馆拓片元数据方案》、《上海图书馆拓片元数据方案》等等。
  元数据的英文名为metadata,其最初的定义是“data about data”。即元数据是有关数据的数据。元数据作为一种编码体系,它们是数字图书馆用以进行知识组织和资源开发的工具,在数字图书馆中的作用是不言而喻的。“河洛文化文献专题数据库·金石拓影子库”建设,以《北京大学古籍数字图书馆拓片元数据标准》为基础,参考国内外元数据有关标准和规范,基本完成了馆藏拓影的数字化。为实现馆藏拓影书目控制和数字化积累了实践经验,为今后馆藏类似文献数字化元数据元素确定与提取,提供了一个触手可及的范本。
  1拓影元数据元素的多元性
  金石拓影的收藏,是一种或主动、或被动、或偶然的带有明显人文特色的文化积淀,大部分收藏均需经过几代收藏人的努力才能集腋成裘。拓影文献没有固定的行文格式,规格差异大,形式多样,内容千差万别,增大了元数据元素提取时的难度。在元数据元素提取实践中,我们既要尊重其元素的多元性,又要区别对待,客观规范,实事求是进行提取和描述。
  在描述性元数据群中,仅题名元素就包括首题、额题、阴首题、阴额题、盖题、中题、尾题、别名等。
  按照古代书写习惯,首题一般位于碑志右侧首行,描述某某碑记或某人墓志。也有少数墓志的题名在志文的末尾部分。如《曹夫人李氏墓志》,其首行为撰文者,末尾题“扶风曹氏夫人陇西李氏墓志铭并序”,此种情况,仍视为首题。有的题名尽管没有实际意义,但仍以首题著录。如“唐故二品宫墓志铭”、“大周故亡宫墓志铭并序”等。在实际操作中,一些墓志首题缺如,直书其文,如《唐徐峤墓志》,首行即书“有唐天宝元年秋九月癸卯江南道探访处置使长乐建安等郡经略使太中大夫使持节晋陵郡诸军事守晋陵郡太守上柱国慈源县开国公徐公薨”,此种情况,我们认为可以根据志文自拟首题,如《唐徐峤墓志》,也可自拟首题为“唐故江南道探访处置使长乐建安等郡经略使太中大夫使持节晋陵郡诸军事守晋陵郡太守上柱国慈源县开国公徐(峤)墓志”,但在附注项应加以说明。
  额题、阴首题、阴额题、盖题的元素确定,一般不容易产生歧义。中题,是指碑文中有两篇或两篇以上各自独立内容的题词或题诗,第二篇及以后篇名称为中题,中题现象一般不常见。
  别名,是指一些碑刻的简称或约定俗成的称谓,同样可以作为一种元数据元素。如《熹平残碑》又名:竹叶碑;《大晋龙兴皇帝三临辟雍皇太子又再莅之盛德隆熙之颂》碑,简称“辟雍碑”;《唐太兴善寺故大德大辩正广智三藏和尚碑铭并序》,简称《不空和尚碑》。
  责任者项也隐含了一个多元选择问题。通常我们说拓影责任者包括撰文、书丹、篆额(盖)、镌刻等。一篇好的碑志文往往有多个责任者共同完成,对碑志负有不同的人文责任。其中撰文者为主要责任者,书丹、篆额(盖)、镌刻者为其他责任者。这里篆者包括篆额、篆盖、题盖等责任方式。若书丹和篆盖者为同一人,则分别著录。无篆盖、题盖的,可著录“不详”。
  镌刻者也属责任者之一,业界有三分书,七分刻之说。责任方式包括镌刻、镌、刻字、刊、刊石、摹勒等,著录时一般规范为“镌刻”。刻字者一般出现在志文的末尾。若书丹、篆额、刻字为同一人者,则著录不同责任方式,若无,可省略。
  2部分元数据元素的确认与转换
  部分珍藏拓影如有金石原件,在数字化时,一定要有金石原件的现状描述和最新的三维照片;如无金石原件,则要注意参考已有研究文献,全面搜寻能真实立体反映金石拓影物理存在和人文依托的元数据元素,要特别关注与金石的流布、迁徙以及拓影的传播和数字对象的时间项等相关联数据元素的确认与转换。
  有关时间元素的确认与转换就特别具有代表性。譬如碑志的刻立年代(或复刻年代),碑刻一般都记载确切的刻立年代,其元数据的提取较为容易,墓志的情况则较为复杂。若有确切的刻制年代,直接著录即可,大多数墓志没有确切的刻立年代,此种情况以志主的葬期为刻制年代。值得注意的是,合葬(同葬)、迁葬(改葬、移葬)情况,每一次埋葬都可能刻有墓志,我们选择最后一次葬期为刻立时间。
  我国古代采用年号纪年,其著录顺序为:朝代、帝王年号、纪月、纪日。如:“北魏正光二年三月十九日葬”。无法考证葬期的,按其卒期年代著录。如:唐开元十一年十月二十七日卒。凡合葬(同葬)、迁葬(改葬、移葬)墓志拓片在葬期后则分别著录“合葬”或“迁葬”。
  墓志中关于纪年的记载名目繁多,著录时要详加甄别。凡记述“年、载、季、岁”的,规范著录为“年”。如“天宝三载”,即“天宝三年”。“首岁”,即元年;“次岁、明年、来年”即“次年”,也就是二年。
  值得注意的是帝王年号必须与朝代联在一起,才能准确表示历史上的年代。因为历史上的帝王年号往往有重袭现象,如“天韦占”年号就有多个帝王用过,不能笼统地著录“天祜多少年”。
  古代纪月一般不用干支,通常用数码表示,如一月、二月、三月等等。岁首的月份叫正月,岁末的月份叫腊月。此外,古代各季、各月还有各自的异称。如正月,又称孟春、寅月;二月又称仲春、卯月;三月又称季春、暮春等等(详见《中文工具书使用法》附表“月季异称表”)。著录时应换算成数码表示。如《宋元孙墓志》中记述:“大中祥符纪号之初蕤宾月二十三葬”。“大中祥符”为宋真宗年号;“纪号之初”应为元年;“蕤宾月”即五月;“因此,应著录为“宋大中祥符元年五月二十三日葬”。我国还有把一个月划分为三旬的习惯,十天为一旬,分别以上旬、中旬、下旬表示。墓志中凡有此记述的,要换算成具体日期著录。如《赵夫人李氏墓志》中记述:“唐开成六年龙集辛酉首春中旬有九日葬”,应著录“唐开成六年一月十九日葬”。   若墓志中的纪年有误的,为了保持与原始文献的一致性,仍按原题著录,但需在附注项予以说明。
  金石拓影采用年号纪年,在年号著录的同时,还应著录公元纪年,用“中国历史纪年与公元年对照表”,将中国古代朝代、帝号等转换为公元年,公元纪年著录到年,如唐开元二年(714)九月五日。
  拓影版刻元素、版本元素同样需要区分和界定。版刻类型主要有原刻、摹刻等。如清代乾隆皇帝命众大臣择选内府收藏的历代名家书法作品,聚集精工,模勒上石,镌刻成帖。全部法帖共收集历代名家135人的340余件楷体、行体、草体书法名品,并各家题跋200余条,印章1600多方,共9万多字,刻石500块,分为32册。由于全部系墨迹上石,刻工精细,故称三希堂法帖;又如咸丰乙巳年《淳化阁法帖》拓本。
  版本一般是指基于同一原刻的不同时间、不同技法、不同颜色等的拓片。包括原石拓本、珂罗版影印拓本、石版影印拓本等。不同时间的拓片著录为某时间拓片,如“清道光年间拓片”、“民国二十年拓片”等等。不同技法的拓片可分为“乌金拓片”、“蝉翼拓片”等。不同颜色等的拓片又有“朱拓”、“墨拓”、“太清蓝”、“佛教黄”等。如洛阳师范学院藏李邕撰书的《云麾将军碑》,著录为“二十世纪三十年代乌金拓片”。
  3参考文献的无障碍获得
  在将拓影原件整理分类以后,元数据著录一般分头进行。多数情况下,拓影元数据元素的确定和提取,是由数据库参建者个体操作,独立完成。有了相对科学的元数据提取标准只是迈出了建库的第一步,与之相配套的还有:元数据提取标准的深度说明、操作培训以及专家交流系统的建立,元数据确定与提取细则的制定,特别是数字拓影已有研究成果(著作、论文、说明、描述)中的元数据元素参稽、筛选,目标参考文献群(相关政书、类书、字典、辞典、文物发掘报告等)的无障碍获得,都是拓影数字化实践的重要支撑。
  例如金石所在地元素主要是指描述金石的刻立或出土、流传与现存地点信息,以省市自治区、县、乡、村处所名称为序著录。金石所在地包括金石刻立、金石出土以及金石收藏地点。金石刻立地点一般不在拓片中体现,要通过实地查勘或通过参考文献获得。出土地点应尽量详细、具体。碑刻则著录立石地点,如《灵运禅师塔铭》,立石地点:河南嵩山少林寺。墓志的情况则比较复杂,官方发掘出土的墓志,在发掘报告中详述出土地点,而民间发现的墓志,往往不提供具体出土地点,只能从墓志铭中去挖掘。墓志铭中大多记载其葬地,那么葬地应视为出土地。有具体葬地的,直接著录,但往往墓志所提供的葬地与现在实际地点不同名,就需要爬梳参考文献确定。《洛阳出土石刻时地记》记述了洛阳出土的2818方墓志的出土时间和地点,是一部不可或缺的参考工具书。如《权开善墓志》,河南洛阳出土,现藏河南省洛阳市新安县“千唐志斋”;《杨元卿墓志》,河南省洛阳市伊川县城关镇渑涧村出土,现藏洛阳师范学院图书馆。在墓志铭中大多关于葬地的记载只提供一个大致方位,如葬于“万安山之南原”、“首阳山之原”、“北邙原”,此种情况,可采用上靠标引原则,分别著录为“河南洛阳伊川县”、“河南洛阳偃师市”、“河南洛阳”出土。
  价值颇高、品相俱佳的碑志,往往由撰文、书丹、篆额、镌刻等不同责任者共同完成,尽管他们的分工不同,但共同对作品负责。著录时要详加考证,防止误著、漏著等现象发生。要全面、准确地提取相应元素,必须有丰富的参考文献作后盾,否则,元数据元素提取不仅事倍功半,整个数据库的质量也无法保证。
  就连纪年这样普通的时间元素,也离不开《历代纪元表》作为时间转换参考文献。我国古代关于年代的记载常见的有三种形式:即帝王年号加年数纪年;帝王年号加干支纪年;帝王年号加太岁纪年。如“天宝十二年”、“咸通辛卯年”等。墓志中的纪年法以第一种俱多。在著录时,清代以前(包括清朝)的用帝王年号加年数纪年,民国间的墓志则以“民国加年数”纪年。对于按干支法或太岁法纪年的,要换算成帝王年号加年数纪年。如“咸通辛卯年”,查《历代纪元表》知咸通元年为“庚辰年”,经推算,“咸通辛卯年”应为“咸通十二年”。又如“唐故江夏李氏室女墓志铭并序”中记述“大中岁在乙亥五月戌申朔三十日疾夭”。“乙亥”为何年,查《历代纪元表》知“大中元年”为“丁卯年”,再按“干支次序表”推算应为“大中九年”。
  4拓影读解与文献参稽
  拓影数字化的文化目标是:全面揭示数字对象的描述性、管理性和GIS元数据元素,使得元数据元素的层级结构清晰明朗,有利于拓影对象的数字传播,有利于拓影对象的后续创新研究,有利于拓影对象知识地图的建立,有利于拓影对象借助数字技术延续自身的物理寿命和拓展文献传播的文化空间。
  要实现上述文化目标,拓影解读是关键,文献参稽比对不可或缺。拓影的“内容校读”(阅读、句读)是金石拓影研究与著录的基本功,没有一定的古汉语基础和古文字知识储备,金石拓影数字化过程中的元数据提取要么错误百出,要么张冠李戴,要么只能停留在文献线索阶段。“碑别字”、“避讳字”、“俗字”,古代当时的行文习惯,书写格式,事主家世,事件背景,礼俗,宗法,职官等,除了依托丰富的参考文献外,还要参稽类比金石原件、同期同类拓影。
  在拓影责任者元素的确定与提取中,撰文者无疑是我们关注的焦点,因而称为主要责任者。主要责任方式包括“撰”、“纂”、“篡”、“述”、“词”、“文”等。在墓志铭中,撰文者一般出现在墓志原题名之后,另起行,低若干字。但少数撰文者则署在志文的末尾。撰文者前面一般都有表示身份或官职的文字。如“朝议郎前行河南府参军上柱国徐备撰”、“侄男卿乡贡进士淇撰”等。凡撰文者为志(碑)主的族亲,一般只述其名不述姓,著录时应在名字前加上姓。如《李耽墓志》,述“亲兄天平军节度使朝请大夫检校兵部尚书兼御史大夫赐紫金鱼袋业撰”,应著录为李业撰。还应特别注意的是夫人墓志,若撰文者为族亲,著录时要辨别清楚,否则,就会张冠李戴。如《唐故泗州司仓参军彭城刘府君夫人吴郡张氏墓志秉并序》,述“嗣子航撰”,嗣子,乃儿子也,故应著录为刘航撰文。又如《郑君夫人崔氏墓志》述“季弟乡贡进士环撰”,季弟应为夫人之弟,因此,应著录为“崔环撰文”,而不能著录“郑环撰文”。有的墓志没有直接署撰文者姓名,而是隐含在志文中,这就需要详加甄别。如《唐故大理鉼事博陵崔府君(元夫)墓琂铭并序》,该墓志铭无署撰文者,但从志文“因令再从侄钧铭文于石,钧诚不敏,方修艺自课,固难以辞,乃作铭日”知该墓志由志主之侄崔钧所撰,主要责任者应著录为崔钧。由此我们可以断定,拓影读解的深度、广度和准确度直接影响到元数据质量,并最终决定数据库的文化寿命。   碑志的价值以及传承知名度,多数得益于书法优劣和书丹者的知名度。数千年来无数碑志名品成为书法传承的临池珍本,书丹大家令后人为之倾倒。比如唐代著名宰相狄仁杰书《袁公瑜墓志》,仿虞世南书体,笔致爽利、端秀,具有清新妩媚的艺术特色;乐温书丹的“夫人席氏墓志”,长笔四展,洒脱奔逸,神采奕奕;民国十二年(1923)的“张子温墓志”,由章炳麟撰文,于右任书丹,吴昌硕篆盖,曾被誉为“近代三绝”。书丹者一般出现在撰文者之后,少数则出现在志文的末尾。若撰文与书丹为同一人者,则分别按撰文者、书丹者著录。若不认真阅读拓影,部分重要元素必然遗漏。
  5个性元素著录要力求完备
  实践告诉我们,元数据元素提取实践与元数据标准设计同样重要,甚至,多数情况下前者比后者更重要。因为标准设计的前提和归宿都离不开实践,科学规范的标准为数字对象的元数据元素提取贡献模型支持,缜密的提取实践又会对元数据标准的修订完善提供专业性支撑。
  同古籍、手稿、书画等历史文献一样,多数金石拓影收藏是由后来者进行整理、研究和数字化。凡有一定数量的收藏机构,当时的收藏者,不管是主动、被动还是偶然,大都对拓影收藏表现出积极的心态,遇到新的收藏任务,专业人员往往比较醉心于金石拓影新发现、新收藏的表层记忆过程。缺少对于和金石拓影相关联的深层文化记忆的适时追问和主动探寻,例如:关于金石原件保存的现状、金石拓影的相对完整性以及金石拓影的文献价值、收藏历史等,完全没有缜密求证的“文化自觉”。给我们今天的金石拓影元数据元素提取,特别是个性元素的完备提取留下了不小的文化理解任务。
  元数据体系中的个性元素要力求完备、详实。按照元数据内容结构及元素定义说明,其他责任者项著录拓片文字的书体、书写特征、行款、存字数等。书体主要包括甲骨文、金文、大篆、小篆、隶书、正书、行书、草书及其他。行数著录碑志的总行数,包括原题名、撰文、书丹、志文、铭文及末尾的落款等。不管每行字数多寡,均算一行;行字数,即每行的字数。墓志的行文,有长行,也有短行,均以最长行计字数。不管行中或空格、或缺字,也均以满行计字数。有个别墓志的末尾有赠制文且字型小于正文,行字数多于正文的,仍按正文满行字数著录。例如《杨元卿墓志》,志文正书,38行,行39字,志盖篆书,4行,行4字。又如《升仙太子碑》,碑文行书,33行,行66字,碑额篆书飞白体,2行,行3字。拓片有多种文字时,每种文字的书法特征前应冠有书写该文字部分的名称。
  载体形态项属于个性化描述性元数据,著录拓片、托裱装订、数量、尺寸、拓片残损情况等,同样要求客观、完备。载体形式著录“拓片”、“拓本”或“拓轴”。尺寸指拓片高、广墨迹的极限,不包括拓纸的空白部分,拓本则以开本的大小为尺寸。高、广长度均以“厘米”表示。如《桓臣范墓志》,拓片,一张,93×93cm;《阿弥陀造像记》,拓片,一张,80×79cm,上下部残缺,中部有一道人工凿痕,残损数十字;《淳化阁法帖》,拓士本,一册,32开,墨拓30×20cm,残缺一册。
  收藏历史作为拓片个别元素,是体现拓影、金石囿人文价值的重要证据链。此项著录获得方式和收藏与跋印。获得方式包括购买、征集或赠与等。征集或赠与的碑志拓片,在此之前,原收藏者往往在拓片上盖有自己的印章或题签。为了说明拓片的来源和充分揭示拓片的原有状况,在著录时应予以反映。如“罗振玉藏拓及题签”。必要时还要参考相关文献,以求广征博引,全面揭示。
  6关于GIS元数据元素
  GIS是Geographic Information System英文字头,即地理信息系统。物质世界中的任何事物都被牢牢地打上了时空的烙印,人们生产和生活中的80%以上的信息和地理空间位置有关。金石拓影的时空烙印毋庸置疑。
  在拓影数据库建设中,应用GIS作为辅助检索工具,突破了传统的文字检索模式,也使历史文化资源的时空特性得以充分揭示,通过直观地显示数据的分布,弥补了传统检索式检索的不足。目前GIS在国内图书馆业界的应用主要是数字化地图的制作与可视化信息检索、GIS系统与外部数据库的关联等,尚处于初步探索阶段。“河洛文化文献专题数据库·金石拓影子库”的GIS应用限于条件,尽管有了预案,仍然处于认识理解阶段,操作实践,尚待时日。
  对于拓片文献来说,GIS元数据元素的基础信息最容易缺失,地缘信息、地域信息、地理信息等都可能在金石原件发现、流徙、传藏和拓影制作、流布、鉴识过程中发生丢失、讹传或谬识,这项工作要特别重视拓影的内容校读、文献参稽和比对,如果实在暂时得不到确认,可以暂缓采用,切忌匆忙定论。待以后穷尽文献,访遍人文再作定议。
  GIS元数据元素中的空间项、时间项涉及到金石原件、拓影原件和拓影内容。以拓影内容的GIS元数据元素为基础,结合金石原件、拓影原件既有信息,参考、挖掘、比对潜在信息,确认有价值的元数据元素。对于地理、地域数据要尽可能详尽并记录其历史沿革;对于地缘数据要像著录人缘数据一样,特别重视数据的连续性和准确性。我们强调连续性,是继承GIS本源的系统性,检点数字对象自身以及关涉的时空知识点,拾贝串珠,形成时空知识链;有了准确性,才能客观反映数字对象的时空存在,保证元数据元素的质量,经得起历史的检验和推敲。
  数字图书馆的理论体系已经为我们建立起美好的专业愿景,百花齐放的元数据方案使拓影信息组织系统架构有了厚重的专业依托。既不拘泥于某一种元数据方案,又要客观、全面揭示数字对象。既要重视元数据方案的提炼和完善,又要强调持续不断的数字化实践,在理论和实践的良性互动中,把金石拓影数字化研究不断引向深入。
  参考文献
  1.北京大学图书馆中文元数据标准研究项目组.北京大学古籍数字图书馆拓片元数据标准(草案).[2007-03-02].http://www.idl.pku.省略/1/page.htm
  2.张靖.拓片元数据标准比较研究.中国图书馆学报,2010(1):52-55
  3.钟碧芬.佛教石刻造像拓本数位典藏计划.2004年12月台湾“中研院”史语所“金石拓片数位典藏研讨会”会议论文.[2006-01-10].http://rub.ihp.sinica.edu.tw/download.htm
  4 ARLGISLiteracyProject.[2006-02-06].http://www.arl.0rg/info/gis/index.html
  5詹萌等.GIS技术在特色数据库项目建设中的应用研究.[2006-02-14].http://www.calis.省略/callsnew/imagesI/neikan/3-3 htm

推荐访问:金石 数字化 提取 实践