面向数字人文的典籍图像深度揭示与利用In-depth Disclosure and Utilization of Images in Classics for Digital Humanities
钱智勇,陈涛,张志美,徐宇红,何书
摘要(Abstract):
典籍图像是馆藏重要资源,图像数字化和内容揭示是数字人文基础建设,可实现“以图证史”“图像叙事”、多媒介传播等应用价值。文章依据图像元数据、资源描述框架(RDF)和国际图像互操作框架(IIIF)等标准规范,研究典籍图像深度揭示与利用的模型架构与实现方法。该模型由图像数字化、内容深度标注和数字人文应用三个相互关联的模块组成。从图像场景、实体对象和语义关联三个层次,揭示图像特征、典籍注释及背景知识,辅助数字人文研究。例证选用经典辞书《尔雅》插图版《尔雅音图》进行数字化,构建《尔雅》多语语义词表并与实体进行关联,深度揭示《尔雅》词汇的古今释义、音韵、分类、典籍注疏、例句典故等知识内容,探究《尔雅》图像的数字人文应用场景。
关键词(KeyWords): 典籍图像;数字人文;《尔雅音图》;深度揭示;IIIF;关联数据
基金项目(Foundation): 国家社会科学基金一般项目“基于关联数据的古代辞书知识组织与应用研究”(编号:21TQB094);; 江苏省社会科学基金项目“大数据环境下典籍多语语义词典构建与知识发现实证研究”(编号:19TQB003)的研究成果之一
作者(Author): 钱智勇,陈涛,张志美,徐宇红,何书
DOI: 10.16603/j.issn1002-1027.2022.05.005
参考文献(References):
- 1 夏征农.辞海[M].上海:上海辞书出版社,1989:330.
- 2 颜佳,杨敏,彭梅.面向数字人文的图像数据基础设施建设研究——以我国图博档领域为视角[J].图书馆,2021(5):51-58.
- 3 朱赛虹.清宫殿版图像典籍述略[J].明清论丛,2018(2):393-401.
- 4 W.J.T.米歇尔.图像理论[M].陈永国,胡文征,译.北京:北京大学出版社,2006:7.
- 5 姜智慧.文学图像化语境下中华戏曲典籍对外出版与传播——以昆曲典籍《牡丹亭》为例[J].中国出版,2020(1):63-67.
- 6 曾子明,周知.面向数字人文的图像语义标注模型研究[J].情报理论与实践,2018 (1):116-121.
- 7 张永娟,刘炜,于建荣,等.基于IIIF和语义知识图谱的印章资源整合与知识发现研究[J].图书情报工作,2020(7):127-135.
- 8 王晓光,谭旭,夏生平.敦煌智慧数据研究与实践[J].数字人文,2020(4):11-23
- 9 陈涛,刘炜,孙逊,等.IIIF与AI作用下的文化遗产应用研究新模态[J].中国图书馆学报,2021(2):67-78.
- 10 杨佳莹,许鑫.民国报纸广告图像资源的语义标注——以《新闻报》所刊的越剧广告为例[J].图书馆杂志,2020(3):96-102.
- 11 Dunst A,Hartel R,Laubrock J.The Graphic Narrative Corpus (GNC):design,annotation,and analysis for the digital humanities[C].14th IAPR International Conference on Document Analysis and Recognition (ICDAR),Nov 1,2017.
- 12 Stork L,Weber A,van den Herik,et al.From handwritten manuscripts to linked data[C].22nd International Conference on Theory and Practice of Digital Libraries,Sep 10-13,2018.
- 13 Cheng X F,Yang J Q,Jiang L,et al.Interpreting and semantically describing Chinese traditional brocade:Xilankapu[J].Electronic Library,2019,37 :474-489.
- 14 Abgaz Y,Souza R R,Japesh M,et al.A methodology for semantic enrichment of cultural heritage images using artificial intelligence technologies[J].Journal of Imaging,2021,7 (8):121.
- 15 刘嘉.元数据导论[M].北京:华艺出版社,2002:42-44.
- 16 袁莉,张晓林.数字图像的元数据格式[J].大学图书馆学报,2001(2):27-30,41.
- 17 Powers S.Practical RDF[M].Published by O'Reilly & Associates,Inc.,2011:1-4.
- 18 Sarah A L.Review:international image interoperability framework(IIIF)[J].Journal of the American Musicological Society,2018,71(2):561-572.
- 19 IIIF Technical details[EB/OL].[2021-07-30].https://iiif.io/technical-details/#core-apis.
- 20 IIIF Image API3.0.0[EB/OL].[2021-07-30].https://iiif.io/api/image/3.0/.
- 21 IIIF Presentation API3.0.0[EB/OL].[2021-07-30].https://iiif.io/api/presentation/3.0/.
- 22 IIIF Search API API1.0.0[EB/OL].[2021-07-30].https://iiif.io/api/search/1.0/.
- 23 IIIF Authentication API1.0.0[EB/OL].[2021-07-30].https://iiif.io/api/auth/1.0/.
- 24 IIIF Change Discovery API 1.0.0[EB/OL].[2021-07-30].https://iiif.io/api/discovery/1.0/.
- 25 单蓉蓉,陈涛,刘炜,等.国际图像互操作框架及拓展应用[J].图书馆杂志,2021(5):85-95,123.
- 26 苏东出.一种改进的黑白二值化方法——谈文献扫描图像的数字化处理[J].情报杂志,2003(5),69-70.
- 27 李文英,曹斌,曹春水,等.一种基于深度学习的青铜器铭文识别方法[J].自动化学报,2018(11):10-11.
- 28 Liang J H,Wang H,Li X J.Task design and assignment of full-text generation on mass Chinese historical archives in digital humanities a crowdsourcing approach[J].Aslib Journal of Information Management,2020,72(2):262-286.
- 29 郑巧英,周晨,彭佳.国家图书馆图像资源元数据规范和著录规则[M].北京:国家图书馆出版社,2013.
- 30 顾廷龙,王世伟.尔雅导读[M].成都:巴蜀书社,1990:31.
- 31 郑樵.通志二十略[M].王树民,点校.北京:中华书局,1995.
- 32 周中孚.郑堂读书记补逸[M].北京:中华书局,1993:402-403.
- 33 郭璞.尔雅音图[M].杭州:浙江人民美术出版社,2013.
- 34 胡奇光,方环海.尔雅译注[M].上海:上海古籍出版社,2004.
- 35 吴洪斌.《尔雅》插图研究——兼论中国古代知识传统[J].南京艺术学院学报(美术与设计),2019(2):69-76,209-210.
- 36 James A W H.Ekphrasis and representation[J].New Literary History,1991,22(2):297-316.
- 37 中共中央宣传部.习近平新时代中国特色社会主义思想学习问答[M].北京:学习出版社,2021:318.