中国历代人物传记数据库(China Biographical Database,CBDB)是一个在线的关联性数据库,截至2008年7月,该数据库共收录约40000人的传记资料,这些人物主要出自7-14世纪。它不仅是人物传记的一种参考资料,还可用于统计分析和空间分析。
CBDB肇始于卓越的中国中古社会史学家郝若贝(Robert M. Hartwell)教授的工作,自他1996年辞世后至今,很多人从内容和技术两方面对它进行了更新。目前CBDB的开发工作由哈佛燕京学社、台湾“中研院”历史语言研究所和北京大学中国古代史研究中心三方合作进行,其目标在于系统地收入中国历史上所有重要的传记数据,并将其内容毫无限制地、免费地公诸学术之用。现阶段正致力于增录更多的宋代人物传记资料。CBDB管理委员会负责对该数据库进行管理,包弼德(Peter Bol)任委员会主席,委员会成员包括来自北京大学、“中研院”、美国加利福尼亚大学和哥伦比亚大学的6位专家学者。
该库数据输入系统现已上线运行,大部分网页为中英双语。使用者可以通过电邮申请账户。该数据库鼓励研究者共同参与,贡献新的数据与其他学者分享。
CBDB的发展
自1932年至1936年,郝若贝收集了超过25000人的传记资料,其中尤以宋代官员为主。在他生命的最后20多年间,他开发建成了一个传记数据库。该数据库在郝若贝教授辞世后作为财产的一部分留给了哈佛燕京学社。此后,傅君劢(Michael Fuller)教授将其中的数据转换为一个更具可用性的格式。目前,哈佛燕京学社启动了开发CBDB项目,继续查核现有数据并增加新的人物。
郝若贝教授自执教芝加哥大学伊始,孜孜不倦地从事中国历史上的社会与经济变迁研究。他以中唐至元代的史料为主要基础,开发了若干研究工具并写就一系列影响甚巨的研究论文。他专注于大批量的资料搜集,当他发现既有学术文献中缺乏这一类的研究时,他便亲自着手于涵盖面广泛的数据集的开发工作。至20世纪70年代中期,郝若贝教授已开发出一个搜集和储存传记的数据库,是迄今为止最大的中国历史库人物传记数据。20世纪90年代初期,郝若贝教授将注意力转向对数据的整理,以备学界之用。他一度筹组了一个由哈佛大学包弼德教授主持的咨议委员会,并将收入的数据和应用程序复制分发给该委员会的成员。
郝若贝教授辞世之际,此项目业已收录了25000人以上的传记和谱系数据及4500条以上的书目数据库。该数据库具有多种以地理信息为参照系的对象和功能。郝若贝教授的数据库现已完全纳入CBDB中,CBDB是目前同类数据库中最全面的。它对中古史研究具有极大价值。2005年北京大学中国古代史研究中心加入了此项目,开始录入新数据并在可能的情况下对郝若贝教授既有的数据加以校正。新的数据系依据王德毅教授修订后的《宋人传记数据索引》电子版输入。
“群体传记学”的方法论
从方法论角度看,CBDB使用的是“群体传记学”(Prosopography),通过对一群历史行为人的生平做集体性的研究,探讨这群历史人物共享的背景特征。其方法是先建立一个研究范围,然后就此提出一组相同的问题,如出生与死亡、婚姻与家庭、社会出身与经济地位、居住地、教育、个人财富之数量与来源、职业、宗教、宦历等。然后,将此研究范围中所有人物的各类信息加以罗列、组合,再通过对这些信息的考察找出具有显著意义的变量。研究者可以检测这些信息的内在相关性及其与其他信息或变量的相关性。
伦敦国王学院的Artemis Papakostouli和Andrew Wareham曾合撰了《近代世界以前的群体传记学项目》一文,从比较的角度对中国历史人物传记系统(CBDB前身)和类似的盎格鲁—萨克逊英国群体传记数据库、英格兰圣公会神职人员数据库、拜占庭帝国群体传记数据库等进行了对比介绍。
CBDB的特点及数据结构
截至2008年春,CBDB收录了39000多人的传记资料。然而,现有数据绝大多数是有关唐代中叶至明代中叶(即8-15世纪),其中宋代(960—1279年)的资料占了绝大部分。
郝若贝教授注意使其收录的传记数据对不同时期的高层官员都具有代表性。1991年,他发现就宋代大多数时期而言,他所搜集的数据已能几乎涵盖其高层官员。他在研究中特别关注那些曾任高官者之间的亲属关系。因此,目前的数据库偏重于高官显宦及其亲戚。这是现有数据库最大的长处之一。
然而,即便是在这些人物的传记数据中,其他各种信息仍有待更详尽的搜集。例如,尽管一个人物所担任的最高官职通常都录入了数据库,但是现有数据中很少能涵盖他历任的所有官职。同样,现有数据库中登载了一个人物现存的主要著述,但未能涵盖已知他所著述的所有书目。数据库记录了围绕一个人物的多种社会关系(如所属的朋党、师从之人或奏荐之人),但是这些数据通常来自当时的传记资料,而非基于对该人物墓志材料的分析。
CBDB包括人物(People)、亲属(Kinship)、非亲属社会关系(Non-kinship Associations)、社会(Status)、入仕途径(Modes of Entry into Government)、宦历(Offices/Postings)、地址(Places)、著述(Writings)等变量。2005年傅君劢教授为CBDB的数据结构撰写了一篇介绍。该文对数据库的主要字段分别做了说明,并勾勒了彼此间的联系,可以引导用户在较短时间内理解CBDB作为关联性数据库的特点,并充分挖掘CBDB的研究价值。
CBDB数据的地图标示与分析
在大量数据中发现一定的模式是使用CBDB数据的一大挑战。为此,该数据库为用户提供了中国历史地理信息系统项目(CHGIS),免费提供公元前221年至1911年行政区划体系的数据集以及1820年与1911年两个年份中不具行政功能的主要市镇的数据集。利用ArcGIS或MapInfo(甚至Google Earth)等GIS软件,我们可以将CBDB的输出数据和CHGIS的数据整合在一起。
当用户对CBDB数据库进行与地理空间相关的查询时,他可以要求查询结果以GIS可用的形式输出。由此得到的文本文档会包含查询中提及的所有地址的经纬度和按各地址汇总的查询结果数。例如,用户要求CBDB列出数据库中所有在1127年到1199年之间登第的进士,然后将这个列表加入GIS(将txt文档作为“X/Y event”加入)。在用户的屏幕中出现该列表后,他就可以使用GIS程序将按地址汇总的查询结果数显示出来。结果显示,数据库中1127年到1199年之间登第的进士集中于两浙、福建、江南东西和成都府等路。
本文的内容和数据均来源于CBDB网站,官方网址为:http://isites.harvard.edu/icb/icb.do?keyword=k16229&pageid=icb.page76535。
来源:《中国社会科学报》 2009-11-18
上一篇:哈佛燕京学社:美国东亚研究的重镇
下一篇:哥伦比亚大学东亚研究所