主页 >> 艺档论坛
艺档论坛
 浅谈艺术档案数字化

上海话剧艺术中心 许淼

    长期以来,传统的纸本档案存在许多缺点,如:工作效率低、速度慢、载体稳定性差、易损坏、信息滞后、无法远程共享等,给艺术档案工作者和利用者都带来了极大的不便。随着计算机科学的发展,电子计算机应用不再局限于以往单一的纯科学计算,而是越来越多地被应用于各类非数值处理领域(如信息检索、信息登记与统计等)。电子文件(即人们在社会活动中形成的,以计算机软盘、磁盘和光盘等化学磁性材料为载体的文字材料)的广泛应用更是加快了无纸化管理的进程。相比较而言,它具有至少以下两个优势:1.可直接由计算机等现代办公设备迅速地处理和传递;2.可共享,也不再受时间和距离的影响等特点。因此,在这种大环境下,我们艺术档案工作者必须跟上时代步伐,积极开展纸本艺术档案数字化工作。

一、 艺术档案数字化的意义
    艺术档案数字化是指把室存中原先用纸张形式存储的档案信息转化为计算机存储设备中电、磁、光电信号的信息并实现对转换后的信息的计算机管理、网络传输和数字化存取。它是艺术档案自动化管理的前提条件,不仅涉及直接用于归档的一次纸本档案全文信息的数字化,还涉及用于检索的二次纸本档案的数字化;不仅涉及文字信息的数字化,还涉及声音、图像等多媒体信息的数字化。
    就目前而言,各文艺院团的艺术档案数字化工作主要表现为对纸本档案进行深度加工,即数字化(电子文件化)。艺术档案数字化的重大意义主要表现为:
    1. 利于保护库存纸本艺术档案资料。通过数字化可以降低原件丢失和损坏的风险,很好地解决了档案资料藏与用的矛盾。例如一些纸质脆弱、发黄褪色的老照片都可以转化成电子文件加以保存、利用。
    2. 便于艺术档案资料的科学管理,缩短二次文献信息的加工时间,提高利用率。传统的档案资料二次开发必须经过选材  录入  编辑  二次利用,耗时长,容易丢失信息的时效性。而数字化了的艺术档案资料可以直接通过网络共享,在第一时间得到最大限度地开发和利用。这种信息利用方式不受时间、地点等条件限制。在提高文艺院团知晓度的同时也满足了各种利用需求。
    3. 艺术档案资料的数字化是一次投入,多次产出的过程。它有利于开展有偿服务,提高经济效益。文艺院团可以制作一些精品剧目或名人名家声像光盘自用或商业发行,通过网络或其它方式进行在线有偿服务或订购,在增加经济收入的同时创造了自身品牌形象。(例如,上海话剧艺术中心艺术档案室就开发制作了“戏剧大师黄佐临”多媒体光盘售价为RMB250元/套,并且在上海话剧艺术中心网站发布了订购信息)
    4. 艺术档案资料的数字化,可使档案信息顺利地与新技术接轨。虽然我国“信息高速公路”尚在起步阶段,但我们作为艺档工作者来说,要敏锐洞悉这一客观形势的变化和要求,为将来“信息高速公路”建设打下基础。

二、 艺术档案数字化的基本技术
    1. 扫描技术。它是最常用的,能够快速将大量印刷型资料数字化的技术,也是各文艺院团进行艺术档案数字化的主要手段。具体做法是采用扫描仪、数码相机等设备将现有的纸本档案等经模数转换成图像保存、利用。转换的质量取决于分辨率(每英寸的采样点,用dpi来表示)和扫描比例。分辨率越高、扫描比例越接近100%,图像还原效果越好,更便于放大印刷等二次利用,但同时电子文件容量越大。这种方法速度快,但不利于艺术档案资料的二次利用(例如,对纸本档案信息资料进行二次文本编辑等),因此它较适用于照片资料及不需要二次文本编辑的纸本档案资料的数字化转换。
    2. 录入技术,即通过各种录入方式将纸质档案信息转化为文本。目前主要录入包括手工键盘录入、手写输入和语音输入等方式。文本格式主要有PDF、TXT、DOC、RTF、WDL、CHM和HTML格式等。在上海话剧艺术中心档案管理系统建设初期,我室曾经尝试过将纸本文件转换成DOC电子文件保存,但在资料利用过程中,发现利用者对资料信息的二次编辑需求不是很多,而且这种方法准确率低、耗时长(主要是由于校对),不适合大规模的档案资料数字化。所以,我室目前对纸本档案资料的数字化转换主要采用扫描技术。
因此,能否科学地进行扫描显得尤为重要。要求:1.尽可能保持其版式的原貌。2.在满足于各种要求的前提下尽可能减小电子文件存储大小(建议设定为300dpi*100%),节约硬盘空间。3.能够通过网络快速传送电子文件。
    3. 压缩技术。数字化了的艺术档案资料通常以压缩形式存储,尤其是对所需储存空间巨大的图像文件、视频文件和音频动态文件。一般来说,图像压缩格式有GIF、TIF、JPG等,其中JPG具有极高的压缩率和更多的功能,可以广泛满足各种利用需求。对于音频和视频动态文件,主要有MPEG和MP3、MP4等压缩格式。
    4. OCR(Optical Character Recognition,光学字符识别)技术。它可以利用计算机软件把扫描的图像文本资料转换成字符文本。例如,我室目前使用的汉王文本王软件。
    5. 音视频捕捉技术。它是对室存多媒体艺术档案资料进行数字化处理的技术。一般来说,多媒体文件的格式主要分为音频和视频两种类型。音频多采用WAV、RealAudio、MP3、MP4、Sound和Audio文件格式等;视频采用RealVideo、Quick、Time、AVI、MPEG、 RealMedia、Advanced Streaming Format等格式。当然,不同格式、不同压缩方式的文件必须要有相应的播放软件才能进行播放。也可以将数字化处理后形成的电子文件刻录成为具备自动播放功能的VCD或DVD,便于利用(大多刻录程序均带有此功能,例如,Nero等)。
    6. 其它技术。直接通过软件生成或获取数字化电子文件,或者通过一定的软、硬件加工处理转换,而得到电子文件的技术。例如,语音识别文件、光笔输入技术等。



室藏纸本艺档资料数字化技术及操作流程

综上所述,21世纪是传统档案管理模式向数字化、数据库系统管理模式转化的时期。我们艺档工作者应该在做好纸本艺术档案资料归档的同时,积极开展艺术档案资料的信息数字化工作。这不但是社会发展的客观需要,也是艺术档案利用工作发展的必然趋势。

三、 数字化工作中的一点体会
    1. 各项技术标准要尽可能,最大限度地考虑各种利用需求。
    例如,在上海话剧艺术中心数据库前期准备阶段,我们已将1995年后的所照片资料扫描入电脑。由于考虑到电脑硬盘容量的问题,都以300dpi*50%精度为扫描设定值。现经过2、3年的艺术档案利用实践后,越来越感觉到扫描扫描精度太小,无法满足现在的很多照片档案利用需求,尤其是照片印刷。经过反复慎重地考虑之后,最终决定重新以300dpi*100%的精度全部重新扫描入电脑。因此,我觉得在正式进行数字化工作前,我们必须做好充足的实践调查工作,最大限度地考虑到各种利用需求,以避免重复建设,浪费人力物力资源。

2. 电子文件的耐久留保存。
    众所周知,依靠目前人们的计算机技术,无法完善地解决电子文件的耐久性保存,一旦计算机出现硬盘物理损坏、死机或感染病毒等情况,都有可能使数据丢失。而我们艺档工作者能采取的措施就是将电子文件制成硬拷贝存档,以确保数据的安全,但这样会造成对硬盘空间容量的需求增大。同时从我们上海话剧艺术中心档案室来看,保存了1950至今的的档案,而且随着时间,会越来越多。备份虽然是目前最有效可靠的方法,但,可能不是最好的方法。我想,这个问题只能寄希望于未来先进的计算机技术吧。

返回顶部
        
 
   
版权所有 上海市文化艺术档案馆 沪ICP备 07030830号 联系我们

沪公网安备 31010602002079号