大规模古籍文本在中国史定量研究中的应用探索The Tentative Exploration on the Quantitative Study of Large-scale Ancient Texts in Chinese history
欧阳剑
摘要(Abstract):
利用新的信息技术与面向数字人文研究的跨学科方法,采用大数据研究理念对古籍文本进行字词的历时词频分布规律可视化分析,以中国史定量研究为例,对部分中国史的经典宏观理论从量化角度进行了初步验证。认为大数据视域下的技术逻辑和人文逻辑相耦合的数字人文研究为人文社会科学经典理论的验证和拓展提供了更多研究空间与研究方法,有利于推进古籍文献深层次的开发与利用。
关键词(KeyWords): 大数据;数字人文;定量分析;计量史;古籍
基金项目(Foundation):
作者(Author): 欧阳剑
DOI: 10.16603/j.issn1002-1027.2016.03.001
参考文献(References):
- 1梁晨,董浩.必要与如何:基于历史资料的量化数据库构建与分析:以大学生学籍卡片资料为中心的讨论[J].社会.2015(2):94-108.
- 2梁晨,董浩,李中清.量化数据库与历史研究[J].历史研究,2015(2):113-128,191-192.
- 3孙圣民.历史计量学五十年——经济学和史学范式的冲突、融合与发展[J].中国社会科学.2009(4):142-161.207.
- 4美埃雷兹·艾登(Erez Aiden).法让-巴蒂斯特·米歇尔(JeanBaptiste Michel).可视化未来——数据透视下的人文大趋势(UNCHARTED:Big Data as a Lens on Human Culture)[M].王彤彤,沈华伟,程学旗,译.杭州:浙江人民出版社,2015:001.
- 5陈云松.黄超.大数据推动社会科学研究深挖潜力[N].中国社会科学报,2015-01-12(B01).
- 6沈浩,黄晓兰.大数据助力社会科学研究:挑战与创新[J].现代传播(中国传媒大学学报).2013(8):13-18.
- 7王兆鹏.三大功能:对未来数字化古籍的期待[N].中国社会科学院院报,2007-09-18(003).
- 8王兆鹏,郁玉英.影响的追寻——宋词名篇的计量分析.2008年词学国际学术研讨会论文集[C].中国词学研究会、内蒙古大学文学与新闻传播学院,2008:16.
- 9李伯重.史料与量化:量化方法在史学研究中的运用讨论之一[J].清华大学学报(哲学社会科学版),2015(4):51-63.
- 10胡俊峰,俞士汶.唐宋诗中词汇语义相似度的统计分析及应用[J].中文信息学报,2002(4):39-44.
- 11徐清,石向实.王唯.古籍数字化资源的深度开发[J].图书情报工作,2007(3):95-97+79.
- 12范佳.“数字人文”内涵与古籍数字化的深度开发[J].图书馆学研究.2013(3):29-32.
- 13马创新,曲维光,陈小荷.中文古籍数字化的开发层次和发展趋势[J].图书馆,2014(2):104-106.
- 14杜晓勤.国学大数据时代来了[N].光明日报.2013-09-16(15).
- 15同14.
- 16贾文龙.数字化时代对史学研究模式的影响.第四届中国古籍数字化国际学术研讨会论文集[C].首都师范大学电子文献研究所、中国诗歌研究中心、亚洲大学资讯学院.2013:14.
- 17 Data driven:Digital humanities in the library[EB/OL].[2015-10—18].http://dhinthelibrary.wordpress.com/.
- 18 McEnery.Tony&Wilson,Andrew.Corpus Linguistics[M].Edinburgh University Press,1996:223.
- 19 Michael Sperberg—McQueen.Text encoding and enrichment.In The Humanities Computing Yearbook(1989—90)[M],ed.Ian Lancashire.Oxford:Oxford University Press.1991.
- 20毛建军.古汉语电子语料库资源与类型概述[J].辞书研究,2011(6):83-93.
- 21汉字简繁文本智能转换系统[EB/OL].[2015-10-06].http://jf.cloudtranslation.cc/.
- 22 Yidong Chen.Xiaodong Shi.and Changle Zhou.A simplified-traditional chinese character conversion model based on log-linear models.International Conference on Asian Language Processing,2011.Penang,Malaysia.
- 23中国历代人物传记资料库(CBDB)[EB/OL].[2015-10-13].http://isites.harvard.edu/icb/icb.do?keyword=k35201.
- 24中国历史地理信息系统(CHGIS)[EB/OL].[2015-10-12].http;//yugong.fudan.edu.cn/views/chgis_index.php?list—Y&.tpid=700.
- 25 Google Ngram Viewer[EB/OL].[2015-10-06].https://books.google.com/ngrams.
- 26欧阳剑.面向数字人文研究的大规模古籍文本可视化分析与挖掘[J].中国图书馆学报.2016(2):66-80.
- 27陆宇杰.许鑫.郭金龙.文本挖掘在人文社会科学研究中的典型应用述评[J].图书情报工作2012(8):18-25.
- 28唐家渝,刘知远.孙茂松.文本可视化研究综述[J].计算机辅助设计与图形学学报,2013(3):273-285.
- 29胡戟.正史中的武则天的正面与侧面[N].北京日报,2015-01-19(019).
- 30李必忠,陈贤华.有关武则天评价的几个问题[J].四川大学学报(哲学社会科学版).1982(2):73-83.
- 31赵文润.论武则天的功过[J].社会科学战线,1999(6):133-140.
- 32李伯重,理论、方法、发展趋势:中国经济史研究新探[M].北京:清华大学出版社,2002:110-121.
- 33王双怀.历代对武则天的评价[J].人文杂志,1996(3):69-74.
- 34同33.
- 35罗志田.走向国学与史学的“赛先生”——五四前后中国人心目中的“科学”一例[J].近代史研究.2000(3):59-94.2.
- 36曾大兴.文学地理学研究[M].北京:商务印书馆出版社,2012:002-003.
- 37同36:74-82.