世界古代文明图像数据库的标注方法

来源:中国文物报
作者:张彬彬

世界古代文明图像数据库是一个长期项目,其延续北京大学图像学实验室的汉代图像数据库与《汉画总录》项目中形成的文化遗产数据化系统性解决方案。该方案共有四个层次,包括:使用国际先进的图像采集与处理技术完成数字化,超越西方图像志与图像学描述开展图像的全信息标注,采用中国视角的“形相学”图像研究理论对图像进行分析与阐释,归结于“有生于无”的图像本体论。在数据库建设中,遵循该解决方案,逐步完成图像调查、著录与研究,逐步建立辅助计算机理解文化遗产图像的标注数据集。

世界古代文明图像数据库的建设基于中国汉代图像数据库的方法。经过30年调查与整理,积累近万件汉代画像石的高精度图像采集数据,包括原石、拓片、线描三种图像,完成画像石墓三维建模,并针对漫漶画像石开展微痕扫描和后期成像技术的研发。建立图-词-物相关联的汉代图像数据库与汉画研究文献数据库并向学界开放。编辑完成《汉画总录》共63卷,获得教育部第九届“高等学校科学研究优秀成果奖(人文社会科学)”一等奖。

对中国之外的古代文明图像调查与整理,中国方法是否有效?团队从古埃及、古希腊、古印度(以犍陀罗为中心)三个古代文明切入。在古埃及方向,联合研究团队已经完成了中埃萨卡拉联合考古与数字化合作项目前三个考古季的工作,目前正在埃及开展第四季工作。11月1日,大埃及博物馆开馆之际,习近平主席向埃及总统塞西致贺信,贺信中鼓励中埃联合考古队在萨卡拉金字塔下探索埃及古代文明的工作。这正是世界古代文明图像数据库中埃及部的工作,其前期成果呈现在上海博物馆“古埃及文明大展”中。在古希腊方向,研究团队以希腊瓶画为对象,用基于形相学的图像标注方法重新标注瓶画图像。在犍陀罗方向,研究团队正在对一批雕塑、岩画、岩刻、钱币等图像资料与原始文献开展分类整理、数字化、图像描述与标注、铭文释读,其中包括阿齐兹德里遗址(Aziz Dheri)、布特卡拉三号(ButKaraⅢ)遗址等地的原始图像,也包括佉卢文、婆罗米文、科希文等原始文献。文明传承,图像与文献并重。世界古代文明图像数据库的建设,正是深入开展文明互鉴的数据基础设施。

在文化遗产数据化系统性解决方案中,图像标注方法是一个中间桥梁。一方面,它将文化遗产的数字化成果向数据化、数智化转换,成为面向用户查询与机器学习的标注数据集;另一方面,它将专家识读、研究图像的结果表示为结构化的、机器易于理解的数据。图像标注方法应该尽可能完整、准确地记录图像研究的成果,其数据表示应尽可能覆盖图像研究关注的各个维度,是一种图像研究的全信息标注。

在计算机视觉方向,目前最重要的图像标注数据集是斯坦福大学李飞飞领导的ImageNet,其中的图像绝大部分是真实世界的照片,大部分标注词是名词性的同义词集(synset),来自普林斯顿大学的WordNet语义数据库。ImageNet的数据也按照WordNet的词汇分类层级来构建,因此,ImageNet可以视为建立在人类语言知识体系之上的视觉知识库,其中的图像是对语词的视觉解释。由此训练的AI对世界的理解也将以语言为中心。同时,该知识体系建立在当代科学的基础上,只适用于呈现对客观世界的理解,无法应用于文化遗产图像标注。

在文化遗产方向,目前最具影响力的图像分类标注系统是Iconclass,对西方艺术图像中的主题、内容、意象等标识词进行分类,可以看作一种图书馆学分类系统,自20世纪70年代初创以来,不断演进。中国图像志索引典借鉴Iconclass的分类模式,针对中国传统图像题材梳理标识词,进行词表分类结构调整和改造。这两个数据集建立在图像志和图像学的理论框架下,主要关注事物、寓意、象征等图像意义。利用中国图像志索引典和Iconclass标注的博物馆藏品数据,分别构成了理解东方和西方传统图像意义的重要数据集。

世界古代文明图像数据库是一个整体项目,当不同文明的图像以同一种方法被识读与研究,纳入同一个数据库框架,以同样的标准完成图像标注时,需要有跨文明的解决方案。在图像标注层次,需要区分图像的文化共性与文化个性。

在图像意义标注方面,将图像呈现的事物当作文化共性进行标注,图像描绘的对象,例如人、动物、植物,图像描绘的生活生产行为,例如制作食物、出行、烹饪食物、歌舞、游戏、农事、狩猎等活动,都可以基于现代的事物认知,使用跨文化的语词概念完成其分类和标注。而将图像表达的指代、象征和寓意作为文化个性进行标注,如特定的图形符号、神祇、故事和传说,呈现了特定文化传统中人的观念与信仰,需要用不同文化系统中的语词概念完成标注。这两个层次的标注,也可以视为一种前图像志描述和图像志分析。将不同文明的图像纳入统一的标注体系,能系统梳理图像的跨文化流变,建立全球谱系,有助于为文明比较与文明互鉴研究提供实证材料。用于图像文化个性标注的词表是去中心设计,体现了对文化差异的尊重;用于图像文化共性标注的词表则可遵从现代科学对客观世界的认识,而不同时代、不同地区对这些客观事物的语词表达,都可以当作现代概念的一种表述实例。

而图像不止意义,基于形相学理论,图像标注还覆盖“图法学”的图像结构和图像性质。图法学关注图像的构成逻辑及构成图像时各部分图像的性质。在标注中,将图像按结构分层,包括线条、形状、图势、形象、构图、图画、幅面、整体单位等层级,按图像局部构成整体的关系分组,这种分组可能是出于构成形象的各局部之间的紧密联系,或形象构成图画时的叙事关系,也可能出于某些构图的考虑。而构成图像的各个部分,可能起到描绘/叙事的作用,可能作为指代或象征,或被用于划分不同的图像区域,也可能作为补白和装饰。图法学的标注无法以图像与语词的关联来表达,因此,在图像标注数据中,还设计了图像与图像之间的关系表达,支持图像的分组和分层,从而可以将图像结构的分析结果以结构化数据的形式来记录。

为了便于图像标注数据的交换和存储,设计了基于XML的图像标记语言——“形相学索引标记语言”(IntericonicityIndexMarkupLanguage,IIML),以图像中的坐标范围划定待标注的图像局部,以坐标关系来量化表达形象之间的空间关系和方位关系,设计图—词关联和图-图关联记录图像的意义标注和结构标注信息。需要说明的是,这种标注方法多年前已经在“汉代图像数据库”的“画面描述”中以自然语言完成了一定程度的实现,通过为描述语言设定句式和标识词,以一种较为规则的文本,记录了图-词、图-图之间的关联。

这一方法的核心思想,则体现在朱青生教授于2000年发表的“网相语”概念设计中,“它要恢复语言在形成书面文字和口头言说之前的原思维状态,即一种在感受和思维状态下的图像和概念的综合体。”在目前的技术条件下,本团队利用数据表示,尝试在形成语言之前的“原思维状态”记录这种图像与观念的连接。

目前,联合团队正在以IIML的方法,分析和标注古埃及木乃伊彩绘棺、希腊瓶画、犍陀罗石刻的图像。汉画图像描述也在这一新的技术条件下进一步完成数据转换与方法扩展。

世界古代文明图像数据库是面向多文明基础材料,整体性推进图像技术的前沿探索及图像理论基础构建,借此完成中国方法的推广应用与检验完善。对图像意义标注中的文化个性标注的研究,涉及不同文化中的观念和信仰的表达,可能脱离物质世界的对象,与当前的数字图像的理解和标注相关。对标注词的梳理和分类,则与AIGC技术的提示词工程密切关联。对图像的图法学标注,具有计算语言学对句法、语法、词性的标注同等重要的意义。IIML的设计具有可扩展性,为图像研究的新问题留有余地,例如,神经图像认知的实验数据也可以进入标注系统。图像标注,关联图像和语言,世界古代文明图像数据库及标注数据集就此关联与人类文明相关的全部问题。

(作者单位:上海外国语大学世界艺术史研究所)

image.png


往期回顾

Copyright Reserved 2024 版权所有 国家文物局主管 中国文物报社主办     京ICP备19002194号-6    京公网安备11010102007559号

网站管理:中国文物报社有限公司 技术服务电话:86-10-84078838-6168

0.1098s