怎么把数字变成以文本存储的数字(以数据驱动的人文学科研究方法)

首页常识怎么把数字变成以文本存储的数字更新时间:2022-12-01 07:53:08

数字人文( Digital Humanities)是在计算机技术和网络科技普及的基础上,以多媒体表达为辅助,借助各项新兴技术支持开展的以人文学科为对象而形成的新型跨学科研究领域。大数据时代数据科学和数据分析技术的相对普及和低门槛化,使人文学科的研究从过去以资源占有为主导因素,转变为如今以数据资源的占有与数据工具的使用为导向而驱动。数据技术的发展为人文学科研究中长期存在的问题提供了新的研究方法和工具,并改变了人们浏览知识的视角、接收知识的方式、生产知识的途径,从横向范围和纵向深度等方面重新拓展和构建了人文学科的研究。

人文知识的数字化在各个学科领域扩展,原生数字人文资源体量快速增加,丰富了人文研究的对象。人文领域学者、计算机技术和数据专家、媒体研究者共同协作,使人文学科向数字计算方向发展,形成新的人文研究课题,丰富数字人文的定义,更新数字人文的研究方法,构建数字人文研究的学术共同体,形成数据驱动型研究。数字人文研究中心、数字人文主题会议等数字人文研究联盟也应运而生,学界不断展开相关议题的研究和讨论。综合学界主流观点,数字人文的技术体系与实现流程大致可分为以下几个方面:

资源数字化:大数据与人工智能技术的发展使大量包括文字与图像的人文资料通过数据计算、量化分析等形式数字化、网络化存储,形成大量的原生数字资源,充实和拓展了人文学科的研究领域。通过对文本和图像的编码,可以构建较长时间跨度和较大规模范围的数据知识库,实现对人文学科数字文本的全面使用。

数据管理:数据管理技术形成了一套行之有效的新的人文学科研究的方法论体系。通过数据分析技术,如文本分析、时空分析、社会关系分析等,建立人文数字资源的数据化链接,建立新的知识单元组织和关联关系,帮助发现事物潜在的趋势、逻辑关系,深入挖掘大规模人文数字对象深层次的叙事逻辑和内涵,帮助展现其历史脉络、文化思想和人文精神,实现对文本集合整体特征的描述和内在结构特征的揭示。新的方法帮助构建新的数据知识环境,形成数字人文的服务系统,把学者从繁琐的资料查阅、分析、整理中解放出来,提高研究效率,加快了人文学者的研究步伐,也加快了面向大众的人文知识普及速度。

可视化技术:运用计算机图形学将繁杂深奥的数据进行加工,将抽象数据进行具象的视觉表达,通过视觉元素帮助人们更快的理解数据的含义。可视化可对学科知识进行再构建,并对其整体趋势进行预测,将隐蔽的内在关联以用户更容易理解的直观、形象的视觉化方式展示和呈现。可视化是对知识进行重新解释的动态过程,是跨越学科壁垒、促进交流与协作的媒介,也是引发批判性思考和讨论美学载体。通过将数据和视觉元素相结合,可视化技术可以传达海量数据资源的潜在规律、宏观趋势、动态特征,提升知识接收过程的体验感,使人文学科的知识更易于理解和接收,为人文知识的呈现与传播提供新的方法与形态,为大规模数据集的分析与研究提供了新路径。

交互技术:数字人文资源的可视化根据不同的任务类型有不同的视觉呈现和交互形式,《数字人文视域下文化遗产图像远读可视化调查与分析》一文中将数字人文交互类型分为:展示浏览型、关联关系型和文化分析型。展示浏览型以人文学科数据呈现与展示为目的,支持用户进行信息搜索和浏览;关联关系型:以可视化的方式发现对象之间潜在的关联,如时空关系、因果关系等,以发现新知;文化分析型:通过计算分析实现对文化内涵的剖析和阐释。前两种交互类型较为常见,而第三类文化分析型更多面向专业用户,如人文学者的科学研究,目前应用较少。数字人文如何通过数字技术激活知识背后的文化基因,体现人文学科的精神内涵、文化传承和当代价值,以及从单向的浏览互动提升至可上传和更新数据的双向乃至多向互动,真正打造活态、立体化的数字人文信息平台,供人文学者使用,有待进一步探索。

人文学科关注人与人、社会、世界之间的关系,核心是为人类的福祉服务。数字人文从方法论角度颠覆了学科的固有问题和基本边界,为人文学科提供了搭建新型研究方法、知识体系、呈现方式和理论框架的途径。通过跨学科的数字人文研究,加强不同领域学者的跨界合作:人文学科研究者提供原始资料与问题导向;数字人文技术专家提供数据分析与算法技术;可视化设计师进行视觉、叙事与交互设计。以此探寻以数据驱动的人文学科研究的新方法,以及人文学科与数据科技有效结合的方式,从而实现文理科之间的资源优势互补与共享。

人文学科数字文本的规范化、标准化等结构化程度,决定了数字功能的发挥程度,目前的数字人文仍缺少系统的理论体系构建,现有各学科相关理论仍各自为政,难以有契合的对应。可视化技术与方法应用尚不充分,面临着难以满足人文领域研究者差异化需求等相关问题和挑战。在数字人文发展过程中,通过数字化方法从不同角度对人文学科的知识资源进行挖掘、使用、重构、进一步激活和再生产,所产生的研究成果可反过来丰富数字人文的资源和推动数字人文的研究体系与方法,再通过进一步结合对数字人文合理性、有效性的评估与规范系统的逐步构建,使数字人文的理论体系处于一个不断自我更新迭代的过程中,逐步增加自身的开放性与包容性,伴随技术的发展而逐步得以完善。

基金项目:基于数据新闻视觉性的国家形象建构研究(19YJC760113),教育部人文社会科学研究规划基金项目

魏婧婧,湖北工业大学讲师,中央美术学院博士在读

来源: 光明网

,
推荐内容
热门内容