出版实务 | 数字内容资源

发布时间:2024年01月05日

本篇博文根据圣才电子书《出版专业理论与实务(初级)》整理。


数字内容资源管理

为了推动内容产业,特别是数字内容产业的发展,业界通常把内容理解为两部分

  • 素材
    • 它是以文本、图片、声音、视频、动画等形式存在的实际的数字对象。它独立于物理载体存在,是一种编码的数字信息。
  • 元数据
    • 描述实际素材和其不同形式的信息,具体又包括与内容相关的元数据、与素材相关的元数据和与位置相关的元数据。

数据是关于客观世界的事实,通常表现为某个变量的定性的或定量的数值,由数字或字符表示。数据既可以是某种记录仪测量记录的结果,也可以是商业交易过程中产生的记录。

位图属于数字图像的格式,图像是人对视觉感知的物质再现。

文本文件常被视为一种纯文本容器,这些纯文本(通常是数字形式的文本)就是常说的文本型内容。在互联网上,最常见的文本就是超文本,常用HTML和XML语言表示。

复合数字对象是一种数字内容集合体,它是包括文本、图像、音频、视频等类型数字对象的复合体,是组合起来形成逻辑整体的多个信息单元的集合。

  • 结构化数字内容
    • 是指存储在数据库内的、可以用二维表结构来逻辑表达实现的各种数据和记录信息。
    • 20世纪70年代以来,大量的结构化信息被存储在数据中,成为企业重要的信息资源。
  • 非结构化数字内容
    • 非结构化数字内容就是没有明显固定结构特征的信息
    • 包括所有格式的办公文档(PDF文档等)文本图片网页、各类报表、图像和音频、视频信息等。
    • 通常包括
      • 办公文件(如Word文档、Excel文档、PowerPoint文档、RTF文档)
      • 小样文件(如InDesign文件、方正飞腾文件)
      • 合同文件
      • 法律文件
      • 绘图文件(如CAD文件、Photoshop文件)
      • ……
  • 半结构化数字内容
    • 是介于完全结构化信息(如关系型数据库、面向对象数据库中的数据)和完全无结构的信息(如声音、图像文件等)之间的一种类型。
    • 包括:音视频、图像、XML文档

数字内容资源的文件格式和管理流程

常见的数字文件格式有

  • 文本文件格式
    • TXT文件格式
  • 图像文件格式
  • 音频文件格式
    • WAV格式
    • MP3格式
  • 视频文件格式
    • AVI格式
    • FLV格式
    • MPEG格式
    • ……
  • 复合数字对象
    • ePub格式

数字内容资源的获取

一般来说,常见的信息内容获取方法与途径包括

  • 付费外购
  • 定向索取
  • 公开征集
    • 是指传统的出版机构常常向社会广泛征集个人作品或通信报道,然后加工成册,形成各种出版物。进入互联网时代,尤其是Web 2.0时代以后,网络上的征集依旧十分流行。这些网站通过普通网民的上传行为,积累海量的数字内容,进而形成了巨大的商业价值。
  • 网络采集
  • 转移和复制
  • 对等交换

数字内容获取的原则

数字内容获取的原则主要包括

  • 针对性原则。
    • 在获取数字信息内容时,要针对不同的需求,选择合适的信息源。
  • 经济性原则。
    • 必须在获取过程中选择合理的途径,实现“投入最少,效益最大”的目标。
  • 系统性原则。
    • 要注意内容的元数据和内容之间的逻辑关系,做好规划,按照一定的策略和方案,尽可能地获取完整的和系统化的内容,为未来提供深度服务做准备。
  • 全面性原则。
    • 全面性要求获取内容资源时必须考虑资源的全面性。

数字内容资源的审核

数字内容资源管理部门必须有内容审核人员承担内容的审核任务。
定期或不定期地抽查内容资源质量
审核内容资源标引的完整性和规范性
审核内容资源本身的全面性和系统性

内容审核校验工作包括

  • 入库审核除了审核内容资源本身是否完整、全面、系统,以及内容文档的题名是否完整、规范、合乎要求外,还需审核内容资源的标引信息,包括:

    • 内容资源的分类标引是否正确、全面、规范;
    • 内容资源的主题标引是否正确、完整、规范;
    • 内容资源的版权信息标引是否正确;内容分散标引是否完成。
    • ??内容审核员不能和内容标引加工人员是同一个人,但是内容标引加工人员之间可以相互审核对方的工作结果。
  • 抽查审核指的是内容管理人员定期或不定期抽查部分内容资源,进行审核校验,这是保证内容资源质量的一种方法。

??不管是入库审核还是抽查审核,内容资源的审核都可以使用机器辅助完成部分工作。

例如,一本图书的不同格式文档的命名和标引信息是否一致。

数字内容资源的存储

数据库除了可以存储和管理字符数据外,还可以管理各种独立文件,如DOC文档、JPG图片、AVI视频,等等。这些文件以大字段的方式存在于数据库中,配合其他数据,调取方便,管理便捷,适用于海量文件的管理。

数字内容资源的分级存储

分级存储的类型主要有

  • 在线存储
    • 是指存储设备永久连接在计算机系统中,并随时保持可实时快速访问的状态,在线存储设备一般采用磁盘阵列;
  • 离线存储
    • 是指存储设备或存储介质平时没有装在计算机系统内,在存取数据时需要将存储设备或存储介质临时性地装载或连接到计算机系统上,当数据访问完毕时,再把存储设备或存储介质脱离;
    • 近线存储
  • 介于在线存储和离线存储之间,既可以做到较大的存储容量,又可以实现较快的存取速度。

数字内容资源的备份要求

数字资产的备份有三个目的

  • 灾难恢复
    • 当主位置因灾难不能工作时,备份的副本将用于在另外一个位置恢复数据。当使用基于磁带的备份方法时,备份磁带一般会被存放在异地,以保证灾难不会同时毁坏原始数据和备份数据。对于恢复速度要求比较高的企业,也可以采用远程复制技术复制数据到灾难点,这样可以快速恢复灾难点的系统运营。
  • 可操作备份
  • 内容归档

数字内容备份的粒度分为

  • 全备份,指某时间点上对生产系统上的所有数据进行完整备份。这种备份时间长,恢复快。
  • 增量备份,指复制自上次全备份或最近发生的增量备份以来修改的数据。由于仅限于修改的数据备份,所以这种备份的速度很快,但是恢复起来却很耗时。
  • 累计备份,指复制自最后一次全备份以来修改的数据。这种备份方式时间比增量方式长,但恢复快。

备份分为两种方式

  • 热备份
    • 热备份时,应用仍处于运行状态,用户可以在备份的同时存取数据,在不可能关闭数据库服务时,可以采用热备份,这种备份会影响数据的性能,导致数据库响应降低,所以热备份通常在深夜用户访问量较低时进行;
  • 冷备份
    • 冷备份时,应用处于停止状态。在实际业务工作中,到底使用热备份还是冷备份,要视具体的业务模式而定,通常在线服务都采用热备份的方式,而企业内的业务系统可以采用冷备份的方式,在员工下班时进行冷备份,不会影响企业的正常业务。

数字内容资源的利用

在机构内部,内容资源的利用必须受到管制,以防止内容被滥用,一般的数字内容资源管理系统都可以根据检索人的系统角色权限大小来确定内容的下载方式和数量。

从内容资源库下载和导出资源的方式包括以下四种

  • 自由下载
    • 是指对检索结果没有任何约束的下载,下载的内容可以是检索结果列表,也可以是正文内容,并没有数量和权限限制。
  • 授权下载
    • 是指针对高价值的内容资源进行的有约束的下载方式。
    • 这些高价值的内容资源包括排版文档、PDF文档、XML文档、高精度图像视频文档等。
  • 批量下载
    • 是指同时对多个内容资源进行的下载活动。
    • 批量下载必须得到授权许可。
    • 为了避免出现恶意行为,批量下载的时间、期限、地点、批次、单次数量都必须受到监控,以防止出现意外结果。
  • 自动下载
    • 自动下载是指根据产品或业务需要定期或不定期的从内容资源库中下载和操作内容资源的行为。
    • 自动下载的审批需要资源管理部门及其上层管理部门进行,审批通过后,支持一定时期内通过机器自动检索并下载特定的内容。
    • 内容资源库常与业务平台关联,自动下载是业务处理和产品运营的保障,必须给予优先保障。

针对文本的全文检索,检索结果多是全文内容的摘要或者少量头部文字。

对于授权下载内容和批量下载行为,需要进行下载审批

  • 当申请下载的内容资源为部门内部资源时,只需本部门的审批人员审批通过即可进行下载。
  • 当申请下载的内容资源为非部门内资源时,至少需要进行两级审批。
  • 自动下载的审批需要资源管理部门及其上层管理部门进行。批准或拒绝下载申请都需要有详细的时间和责任人记录,所有日志记录必须留存备查。

版权资产管理

版权资产可看作被机构、组织或个人,特别是文化型企业所拥有或控制的、能够发挥持续作用并能带来经济效益的版权的财产性权益以及与版权权利相关的财产权益。

版权资产是文化资产的主要组成部分,是文化型企业运营和发展过程中形成的主要资产形式,是推动文化产业持续发展的重要基础和支撑,是版权内在价值在文化型企业层次上的直观体现,是文化产业的核心资源。

版权资产的特性主要体现在

  • 非独立性
  • 排他性
  • 流动性
  • 可增值性
  • 社会性

资产分为

  • 有形资产
    • 包括各类物质、物资和产品
  • 无形资产
    • 包括知识、权益、信息、投资、管理、技术、经济等方面的非货币性资产
    • 版权资产作为一种无形资产,满足无形资产的可辨认性、对资源的控制性和未来的经济利益三个特性。故而可判断出,版权资产不存在“仓储”一说。

【例】简答题:根据所给材料回答问题。[2016年真题]
????????????????????????????????????
甲出版社拟建设一个教学内容资源库,计划收录的资源包括教学文案、教学课件、教学实录、英语听力材料、教育理论资料,以及一个数字化题库。
经过专业技术人员的一番努力,该内容资源库所需的各类材料基本齐全了。其中:教学文案都是TXT格式文件;教学课件为PPT格式文件;教学实录是用数字摄像机拍摄的课堂教学实况,并作了剪辑处理;英语听力材料是用数字录音设备录制的,也作了剪辑处理;教育理论资料是对甲出版社早年出版的相应图书进行扫描后形成的JPEG格式文件;数字化题库的素材是从甲出版社所出教辅图书的电子排版文件中提取出来的,并按知识点、难度、题型、来源、分值等元数据分别对每道题目作了标引后形成的数据库文件。
在此基础上,甲出版社还准备根据本社初中数学教材的教学特点,将该资源库中各项相关内容进行整合后,形成一个可供教师使用的“初中数学产品包”。为此,需要将这些已有的内容材料添加到资源库中,以方便内容整合。
????????????????????????????????????
问题一:按照表现形式划分,与该教学内容资源库相关的下列内容分别属于什么类型的资源?请作选择回答。
①教学文案属于( 文本资源 )类资源;
②英语听力材料属于( 音频资源 )类资源;
③教学实录属于( 视频资源 )类资源;
④初中数学产品包属于( 复合数字对象资源 )类资源;
⑤教育理论资料属于( 图像资源 )类资源。
????????????????????????????????????
问题二:若按结构划分,与该教学内容资源库相关的材料分别属于什么种类的数据?请作选择回答。
答:
①教学课件是( 非结构化数字内容 );
②英语听力材料是( 非结构化数字内容 );
③教学实录是( 非结构化数字内容 );
④数字化题库是( 结构化数字内容 );
⑤教育理论资料是( 非结构化数字内容 )。
????????????????????????????????????
问题三:这些内容资源入库时应该经过什么程序?该程序中主要需做哪些工作?
答: 内容资源入库时要经过审核程序。该程序中主要需做的工作包括:
(1)审核内容资源本身是否完整、全面、系统;
(2)审核内容文档的题名是否完整、规范、合乎要求;
(3)审核内容资源的标引信息是否准确。

文章来源:https://blog.csdn.net/qq_44250700/article/details/135413657
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。