• 25
  • 11,2024

中国研究开放数据库资源指南

本指南概述中国研究相关的开放数据库和免费资源。该指南由 Joshua Seufert(普林斯顿大学图书馆)和 Luo Zhou(杜克大学图书馆)为Luce/ACLS 数字档案馆地图项目编辑。本指南将定期更新,扩展目录将于 2025 年冬季发布。

跨库检索

CrossAsia 综合文本资源库

https://crossasia.org/en/service/crossasia-lab/crossasia-itr-fulltext-search/

CrossAsia 是一个发现亚洲研究主要和次要资料的门户网站。它可在多个东亚研究数据库中进行全文跨库检索,也可在印刷书籍中进行全文检索。


常春藤联盟图书馆( IVY-Plus Libraries)中文全集https://docs.google.com/spreadsheets/d/1I5DwJkpuZAnHrHC-8Be4NOuDuh5mA6dx2oG-OZ60pzg/edit?pli=1&gid=654624445#gid=654624445

近年来,中国大陆的出版商印制了大量的一级和二级印刷材料。该电子表格由普林斯顿图书馆的 Joshua Seufert 维护,提供了中国大陆出版的大型原始资料集的书目信息和常春藤联盟持有信息。该列表的有效期至 2024 年 7 月,包含目前由常春藤联盟图书馆持有的 2947 种图书。OCLC 图书馆代码为:RBN Brown、CGU Chicago、ZCU Columbia、COO Cornell、DRB Dartmouth、NDD Duke、HUL Harvard(Main Library and Yenching)、HFL Harvard Fine Arts、HVL Harvard Law、JHE Johns Hopkins、PUL Princeton、PAU Upenn、STF Stanford、YUS Yale 和 CRL Center for Research Libraries。


ReCAP Chinese Journals public list(中文期刊公共列表)

https://docs.google.com/spreadsheets/d/165PydKvnv1nmWKMpi8bYFsKnY-ZMhkKNJ5gku7WdNCA/edit?gid=965348405#gid=965348405

该电子表格提供了 ReCAP 联盟图书馆存档的 1350 种中文期刊的持有信息。ReCAP 包括哥伦比亚大学、普林斯顿大学、哈佛大学和纽约公共图书馆。


East Asian Gateway Service(东亚网关服务)

https://library.pitt.edu/eal-gateway-service

由匹兹堡大学图书馆系统提供支持,主要为研究人员免费提供中文学术出版物全文。EAGS 向任何以研究和教学为目的的个人研究者或在美国任何图书馆都找不到所需文献的非营利组织提供中文文献。


学术论文(二手材料)


国家哲学社会科学文献中心 (中国社会科学院)

https://www.ncpssd.cn/journal/index

该开放存取平台包括近 2500 种期刊(期刊&集刊&辑刊)、20000 种中国善本书(高分辨率扫描,但有水印)。(机构可申请,访问权限基于机构 IP )


香港期刊在线

https://digitalrepository.lib.hku.hk/hkjo?rows=100&sort=title_si+asc

全文图像数据库,提供香港出版的精选中英文学术和专业期刊。


台湾期刊文献信息网

https://tpl.ncl.edu.tw/NclService/

收录台湾、香港及澳门出版的中西文期刊,部分有全文,部分只有索引,但搜寻期刊名称可在其平台上找到这些期刊的开放资源。


PubScholar (中文)

https://pubscholar.cn/

中国科学院出版的免费数据库,包括学术期刊文章、预印本、专利和学术数据集等。内容集中在科学和工程领域。


澳门虚拟图书馆

https://www.macaudata.mo/

收录多份本地学术机构刊物,以及政府和教育机构出版的电子书。


专题指南及书目


Chinese Historiography Bibliography(中国经典文献工具书录)

https://libguides.princeton.edu/chinese-historiography/

本杰明·艾尔曼编撰的中国历史文献研究指南


香港文学资料库

https://repository.lib.cuhk.edu.hk/sc/collection/hklit


Modern Chinese Literature and Culture(中国现代文学与文化资料中心)

https://u.osu.edu/mclc/

收录中国现代文学领域的书目、在线资源目录以及相关主题的博客。


PRC History(中国历史)

http://prchistory.org/

收录《记忆》《昨天》和《往事》等中文期刊。


中国改革开放数据库

http://www.reformdata.org/records/

1978-2018 年政治事件的详细时间表。列出的事件附有演讲全文、图片、文章和口述历史录音的链接。如需下载文章、图片等,需要注册个人账户。


Ivy Plus Libraries Digital Projects on East Asia(常春藤联盟图书馆东亚数字项目)

https://guides.library.duke.edu/ivypluseastasia

常春藤盟校图书馆分享其已出版和正在进行的数字项目的平台。


报纸(原始资料)


晚清和民国时期的中文报纸集

https://gpa.eastview.com/crl/lqrcn/

该数据库收集了 1911-1949 年间的 292 份民国地方报纸。这些报纸均可全文检索。该数据库中的报纸进行了文本电子化,并且可复制。其中包括:东南日报(上海)、华北新报(北京)、华光日报(南昌)、立报(上海)、南京晚报(南京)、群力报(山东胶东)、时事新报(上海)、实报(北京)、 苏州明报(苏州)、铁报(上海)、武汉日报(汉口)、西南日报(重庆)、新华日报(汉口)、新申报(上海)、 中山日报(广州)、中央日报(上海)。


二十世纪初省港澳通俗刊物双语数据库及注释书目

https://www.cantonpp.com/tc

直至20世纪中期,穗港澳三地之间一直存在着作者共享、广告跨境、发行网络重叠和文化符号共通的现象。在以往研究人员和图书馆员工作的基础上,该数据库收集了储存在各种数据库、香港、澳门和英国图书馆以及私人收藏中的流行期刊的信息,将这些信息汇集到本网站的 80 个条目中,共同为 “广东文化区域”提供了丰富的表现形式。


Old Hong Kong Newspapers(香港旧报纸)

https://mmis.hkpl.gov.hk/old-hk-collection

该合集提供图书馆收藏的香港旧报纸的数字化图像,可通过香港公共图书馆多媒体信息系统查阅。


East Asian Newspapers and Periodicals 1850-1950(1850-1950 年东亚报纸和期刊)

https://archive.org/details/eastasia-periodicals?and%5b%5d=mediatype%3A%22collection%22

收录包括 1850-1950 年期间以中文、韩文和日文出版的 266 种东亚(加上新加坡)报纸、期刊和杂志。


数字档案


台湾“中研院”近代史研究所档案馆馆藏检索系统

https://archivesonline.mh.sinica.edu.tw/

为读者提供目录检索和数字图像浏览功能。馆藏文献可大致分为五类:外交部藏书(1861-2009 年)、经济部藏书(1903-1980 年)、个人文件、其他组织和历史地图。这些藏品中有一半已经数字化,其中 60% 的数字化藏品可以通过该系统直接在线阅览,其余的只能在现场阅览室阅览。对于那些希望阅览尚未数字化的项目的人,也可以通过该系统申请阅览原件。


清代档案数字图书馆

https://qingarchives.npm.edu.tw/index.php

台北故宫博物院清代档案数位图书馆整合了前大会议档案数据库,清代宫中奏档摺及军机处档摺件,清史人物列传及史馆档案传包稿数据库,清代文献档案目录数据库,及台北故宫所藏其他清代档案。新数据库是免费的,不再需要用户名和密码。


Modern History Databases (MHDB)近代史数位资料库

https://mhdb.mh.sinica.edu.tw/

由台湾“中研院”近代史研究所维护,提供 18 个数据库的跨库检索,收录清至民国时期的历史和文学文献及出版物。跨库检索只需注册即可免费使用,但在各组成数据库内进行检索往往能提高检索结果和检索效率。


Chinese Historical Christian Database中国基督教历史数据库

https://chcdatabase.com/zh/#about

中国基督教历史数据库(CHCD)量化和可视化了基督教在近代中国(1550-1950 年)的地位。它提供中国所有基督教教堂、学校、医院、孤儿院、出版社等所在位置,并记录了在这些建筑内工作的中外人士。这些信息共同绘制了空间地图,并生成了关系网络,揭示了西方思想、技术和实践进入中国的时间、地点和方式。同时,它还揭示了中国的思想、技术和实践是如何以及通过谁传达给西方的。


China Unofficial Archives 中国民间档案馆

https://minjian-danganguan.org/zh

收录中国民间个人制作的独立杂志、书籍和纪录片作品。这些作品基于不同的政治、民族或性别视角,对中国历史进行新的诠释。该馆于 2023 年底启动,收藏了 850 多件此类作品。它们以开放下载的形式免费提供。每个项目都有双语介绍,解释其意义,并可根据创作者、时代、主题和格式进行标签搜索。


Xinjiang Documentation Project(新疆文献项目)

https://xinjiang.sppga.ubc.ca/

新疆文献项目是一个多学科研究项目,设在不列颠哥伦比亚大学公共政策与全球事务学院亚洲研究所和西蒙弗雷泽大学性别、性和妇女研究系。该项目收集、保存、评估和提供有关中国西北部新疆维吾尔自治区维吾尔族、哈萨克族和其他民族的文献资料。


民国时期资料


Early Chinese Periodicals Online(中国早期期刊在线)

https://ecpo.cats.uni-heidelberg.de/ecpo/

由海德堡大学主办,收集清末和民国时期的报纸和其他期刊。重点是清末民初的中国妇女杂志和娱乐报刊。


抗日战争与近代中日关系文献数据平台

https://www.modernhistory.org.cn/#/

中国历史研究院近代史研究所承办的免费数据库,侧重于甲午战争和中日关系的材料,同时提供民国时期的大量资源,包括档案、书籍、报纸、期刊、共产党出版物、录音、照片甚至乐谱。


台湾华文电子书库

https://taiwanebook.ncl.edu.tw/en

收录 1911 至 1949 年间出版的中文书籍的免费电子书数据库。


全球汉籍影像开放集成系统

https://guji.wenxianxue.cn/

全球首个古籍数码影像检索平台已完成第一阶段工作,汇集了全球90多个中文古籍数据库的影像资料,共17万个条目(约136918部作品及32654卷书籍)。该系统的核心功能是提供古籍版本图像的一站式访问和阅读。


口述史料


Telling stories: Linguistic diversity in Hong Kong(讲故事:香港的语言多样性)

https://www.eng.cuhk.edu.hk/ENGE-TellingStories/index.html

免费提供香港历史上使用或现今使用的多种语言和变体的语音样本和翻译数据库。


The Memory Project(记忆计划)

https://repository.duke.edu/dc/memoryproject

这部口述历史资料集收录了对 20世纪五六十年代中国农村的大饥荒幸存者的 739 篇访谈。


数字人文工具和数据集


Chinese Religious Text Authority 宗教书籍规范索引

https://crta.info/wiki/Main_Page

提供有关中国宗教典籍的书目和学术信息,重点关注 1949 年以前的典籍。该索引的目标是将藏书、档案和私人图书馆的书目信息联系起来,以绘制出宗教典籍的制作者、出版者和发行者之间的详细关系网。在项目的第一阶段,重点关注主要重印本收藏中 1949 年前的中国宗教典籍语料库。这个开放存取的国际合作项目所产生的数据可能揭示以前未被发现的关联。


数字村庄

https://www.chinesevillagedata.library.pitt.edu/

由中国村镇地名录数据组成的开放数据集。村庄地名录记录了各个村庄的统计数据,涵盖 1949 年至今的各个年份,展示了中国村庄的历史和发展。


LoGaRT:: Local Gazetteers Research Tools(地方地名词典研究工具)

https://www.mpiwg-berlin.mpg.de/research/projects/logart-local-gazetteers-research-tools

一款用于搜索、分析和收集数字化中国地方志数据的软件。除单独浏览和阅读外,它还为历史学家提供了地名录集合的鸟瞰图。LoGaRT 背后的理念是将所有可用的数字化地名录视为一个概念数据库,用于历史查询。因此,LoGaRT 允许历史学家提出更大规模的问题,这些问题不一定受地理区域、时间段或个人努力的限制。数字化的中国地方志有很多,其质量和许可条件各不相同。目前,通过 LoGaRT 可以访问两个高质量的收藏集:哈佛燕京图书馆的Rare Local Gazetteers(罕见地方志)和 《中国方志库》。


DocuSky数位人文学术研究平台

https://docusky.org.tw/DocuSky/home/v5/?l=en

台湾大学数字人文研究中心建立的一个在线平台,为数字人文研究提供数据集、数字工具和学习资源。


China.AidData.org

https://china.aiddata.org/

AidData 独一无二的全面数据和分析提供了严谨的证据,说明中国海外发展项目不断变化的性质、规模和范围、对地球的影响,以及南半球对中国的看法。


照片和视觉媒体


西德尼·甘布尔(Sidney Gamble)摄影作品,1906-2007 年(杜克大学)

https://repository.duke.edu/dc/gamble

甘布尔在中国九年的四次旅行中拍摄的 5500 多张照片和 20 多部影片。


海达·莫里森(Hedda Morrison)的中国照片(哈佛大学)

https://library.harvard.edu/collections/hedda-morrison-photographs-china

海达·莫里森 1933-1946 年在中国生活期间拍摄的 6000 多张照片。


East Asia Image Collection(东亚影像收藏馆)(拉斐特学院)

https://dss.lafayette.edu/collections/east-asia-image-collection/

记录了日本帝国(1868-1945 年)、“亚洲帝国”(1895-1945 年)和被侵占的日本(1947-1952 年)的历史。其中包括中国台湾、日本、中国大陆、朝鲜和印度尼西亚的图片。


Historical Photographs of China(中国历史照片)(布里斯托尔大学)

https://hpcbristol.net/

保存21000 张图片,其大部分是来自英国和欧洲的藏品。


传记数据库


China Biographical Database Project (CBDB)中国历代人物传记资料库

https://projects.iq.harvard.edu/cbdb/home

可免费访问的关系型数据库,包含 535181 人(截至 2024.02)的传记信息,主要为 7 世纪至 19 世纪。


Modern China Biographical Database(现代中国传记数据库)

https://bookdown.enpchina.eu/mcbd_usermanual/

可免费访问的关系型数据库,旨在记录晚清和民国时期(1830-1949 年)活跃在中国的所有历史人物,无论其出身、国籍和在华时间长短。目前拥有 75000 多人的数据,包括 20000 个职位和 6,000 个课程/学位,以及 10000 个机构和 14000 家公司的信息。MCBD 的一大特色是以个人姓名的所有形式(包括中文姓名和西方语言资料中的各种音译形式)展示传主。


The Treasury of Lives(人物库)

https://treasuryoflives.org/donate

关于西藏、内亚及喜马拉雅地区的人物传记。自 2007 年起开始编写,为该地区已故的著名人士提供了简明易懂、经过深入研究的传记。大多数文章都经过同行评审。动态地图使内容更加丰富。


党/国家文件


PRC State Council Archive中国政府网(英文)

https://english.www.gov.cn/archive/

https://www.gov.cn/(中文——译者)

这是中国政府提供的免费资源,可查阅英文翻译的白皮书和部委文件。


习近平系列重要讲话数据库

http://jhsjk.people.cn/

《人民日报》提供的免费资源。


党史电子书档案

https://ebook.dswxyjy.org.cn/

该数据库是中共中央党史和文献研究院提供的成果总库,可查阅党的领导人文集和讲话,以及“建党以来重要文献”和“建国以来重要文献”系列等文献。


数字手稿和善本书库


中国国家图书馆数字资源

https://www.nlc.cn/pcab/zy/zhgj_zyk/

中国国家图书馆向公众开放了 21 个中华古籍保护网数据库。可通过国家图书馆访问以下数据库:

    ·数字古籍:国家图书馆收藏古籍15万部,其中善本古籍直接继承了南宋缉熙殿、元翰林国史院、明文渊阁、清内阁大库等皇家珍藏,以及明清以来许多私人藏书家的毕生所聚。

    ·数字方志:国家图书馆藏地方志文献建设,主要包括为清代(含清代)以前的方志资源6529种。

    ·中华寻根网中国家谱数据库:包含近30000家谱的书目信息,并提供 2000 多家谱的阅读权限。该系统还链接了6000多部地名录。

    ·中华寻根网:中国家谱数据库,包含近30000家谱的书目信息,并提供对2000多家谱的阅读访问。该系统还链接了6000多部地名录。

    ·赵城金藏 :在金代刻的一部大藏,藏于赵城县(今属山西洪洞县)广胜寺。全藏约七千卷左右,六千多万字,现存四千余卷。

    ·年画撷英:杨柳青、朱仙镇等地制作的年画作品,目前发布元数据及影像302组。

    ·碑帖精华:该数据库可对已转录的拓片进行全文检索。历代甲骨、青铜器、石刻等类拓片数字资源。现有元数据2.5万余条,影像3.1万余幅。

    ·宋人文集:精选所藏宋人文集善本二百七十五部,首选宋元刊本,次及明清精抄精刻,或经名家校勘题跋之本,通过缩微胶卷还原数字影像。

    ·甲骨世界:以国家图书馆藏有的历代甲骨、青铜器、石刻等类拓片二十三万余件为基础建设,现有元数据2.5万余条,影像3.1万余幅。

    ·西夏文献:包括西夏文献书目数据124条,原件影像近5000拍。

    ·西夏论著:包括西夏研究论文篇名数据1200余条。

    ·前尘旧影:收录了国家图书馆收藏的新旧照片3074组。

    ·徽州善本家谱:收录中国国家图书馆藏善本古籍中徽州家谱243种286部,配有书影5437幅。

    ·中华医药典籍资源库(测试版):目前首批对221种中医古籍影像进行发布测试。

    ·法藏敦煌遗书:法国国家图书馆馆藏全部敦煌遗书高清数字资源。共计5300余号3.1万余拍。

    ·云南图书馆古籍:云南图书馆珍本,包括明代云南丽江木氏土司家族著述。

    ·天津图书馆古籍:总量约5800余种300万拍明清古籍数字资源。

    ·上海图书馆家谱:明清家谱资源2200余种。

    ·东文研汉籍影像库:东洋文化研究所藏中文古籍4000余种。

    ·哈佛大学善本特藏:目前在线发布经部和史部善本数字资源741部,另有齐如山戏曲小说专藏204种。

    中华古籍善本联合书目:海内外图书馆所藏古籍善本,数据达2万多条,并配有1.4万余幅书影。



Chinese Rare Book Digital Collection, Library of Congress(美国国会图书馆中国古籍善本数字典藏)

https://www.loc.gov/collections/chinese-rare-books/about-this-collection/

中国古籍善本数字藏书从美国国会图书馆亚洲部收藏的 5300 种中国古籍善本中汲取精华。在线展示近 2000 种数字化珍本,包括美国国会图书馆亚洲部收藏的最有价值的书籍和版本,其中一些可以追溯到 11 或 12 世纪,是世界上唯一的现存版本。这一新的数字收藏汇集了印刷书籍、手稿、佛经、手绘作品、地方志和古代地图。涵盖了经典、历史、地理、哲学和文学等多个学科和主题。大部分是明朝(1368-1644 年)和清朝早期(1644-1795 年)的版本,近 30 种是宋朝(960-1279 年)和元朝(1279-1368 年)的版本。


哈佛燕京中国善本书库

https://curiosity.lib.harvard.edu/chinese-rare-books?utm_source=library.harvard

哈佛燕京图书馆的中国珍本藏书包括从 13 世纪到 19 世纪的中国书籍,内容涵盖古典与历史、哲学、藏书和独特的手稿。藏书包括:

    ·1500 部宋、元、明雕版印刷书籍(包括复本),其中 188 部在中国大陆及港台地区和日本的主要图书馆中都找不到。

    ·约1500 份手稿。

    ·宋、元、明时期的类书,包括《三才图会》《山堂肆考》和《唐类函》。

    ·近 2600 种地方志,包括 720 种明代至乾隆年间印刷的珍稀版本。

    ·禁书及女性作品。


Chinese Text Project(中文文本项目)

https://ctext.org/

该网站提供准确和易读的中国古代(特别是先秦和汉代)典籍副本,并尽可能利用现代技术来帮助学习和研究这些典籍,从而使尽可能多的受众能够获取这些典籍。


Buddhist Digital Resource Center(佛教数字资源中心)

https://www.bdrc.io/

BDRC 开发了佛教数字档案(BUDA),作为佛教典籍的合作平台,以造福佛教界和 BDRC 在学术界的众多用户。凭借新功能和创新设计,BUDA 极大地改善了对大量藏传佛教作品以及梵文、中文、巴利文、缅甸文和高棉文资料的访问。它是开放源代码,并尽可能开放存取。


中国写本文献数字资源库

https://xieben.cadal.edu.cn/

该数据库由中国学术数字图书馆(CADAL)运营,其中包括敦煌手稿(收录的图像主要来自中国和英国,但今后几年会有所增加)以及其他地方手稿。该数据库可免费使用。请注意,该数据库最好使用 Edge 和 Chrome 浏览器。


地理信息系统和空间研究


中国历史地理信息系统(CHGIS)

https://chgis.fas.harvard.edu/

于 2001 年 1 月启动,旨在建立公元前 221 年至公元 1911 年中国历史时期的人口居住地和历史行政单位数据库。


Land Survey Maps of China, 1895-1944(1895-1944 年中国土地测量图)

https://chmap.mpiwg-berlin.mpg.de/lgtu-new/

提供快速访问 19 世纪末和 20 世纪初由中国中央政府和省级政府或日本陆军土地测量部门绘制的 4088 幅中国土地测量图的途径。这些地图是第一批提供精确和大比例尺(1:50000)的中国本土广阔地理前景的地图。在 CHMap 中,用户可以访问这些由上海交通大学数字化、马克斯·普朗克科学史研究所、以及台湾“中研院”的土地测量图。


Modern China Geospatial Database(近代中国地理空间数据库)

https://analytics.huma-num.fr/enpchina/MCGD_interface/

旨在识别和收集历史资料中中国地名的所有名称变体。其中包括西方人指称地名时所使用的各种音译系统(例如Shanghai: Shang-hae, Changhaï, Schanghai等等)。MCGS 搜索界面可用于识别和查找地名。用户可以单独搜索地名,也可以上传 CSV 文件形式的地名列表。搜索引擎检索任何中文地名或任何音译地名,并提供地理坐标、当前中文地名和拼音地名以及所有已知名称。


Mapping Global China(绘制全球中国地图)

https://mapglobalchina.com/

旨在通过数据驱动的分析和研究,为中国的全球经济努力提供独特视角。项目包括有关中国国际参与的地图、数据集和研究,如 “一带一路”倡议。资源汇集了各种可靠来源的信息,其中包括 Reconnecting Asia Project Database(重连亚洲项目数据库)、香港大学香港人文社会科学研究院、AIDDATA GeoQuery、波士顿大学全球中国数据集、澳大利亚战略政策/国际网络政策中心以及上海纽约大学汇编的项目。每个项目都与卫星图像相连,用户可通过卫星图像了解项目开发前后地区的变化情况。


原文链接:中国研究开放数据库资源指南


Copyright © 2012. 中国人民大学汉语国际推广研究所 汉学研究中心 All Rights Reserved

技术支持:升星时代