---以照明产品为例
曹小兵1 王益群2 蔡纯3 黄华2
(1.旭宇光电(深圳)股份有限公司;2.深圳市标准技术研究院;3.深圳市计量质量检测研究院)
摘 要:基于元数据的概念与产品核心元数据要素,阐述国内外元数据研究成果及现状,本文选取照明产品
核心元数据标准化典型案例,针对照明产品核心元数据标准化体系提出建议,从应用层面聚焦产品
核心元数据规范及展望标准应用前景。
关键词:元数据;核心元数据;照明产品;标准
1 引言
随着我国信息技术突飞猛进的发展,各行各业涌现出大量的产品信息数据。面对海量的信息资源,如何对其进行有效的组织、管理与利用,已成为各行业急需解决的共性问题。元数据是解决这一问题的有效途径,科学合理的元数据能够提高产品信息的共享程度和使用效能。目前信息资源的利用与实际应用尚有很大差距,其中一个很重要的因素是亟待解决的产品元数据体系标准化。
我国是照明产品的生产及使用大国,拥有丰富的照明产品信息资源,且信息源具有数量大、分布广、形式多样、增长迅速及组织松散等特点,对产品信息标准化需求强烈。研究和制定我国照明产品核心元数据标准能够为科学组织和管理我国照明产品信息资源提供方法、技术和手段,对推动照明产品信息管理智能化具有重要意义。
2 元数据及其标准化
2.1 元数据定义和功能
元数据是关于数据的数据(data about data)。北京大学数字图书馆研究所中文元数据标准研究项目组给出了元数据的扩展定义:元数据是描述一个具体的资源对象,并能对这个对象进行定位管理,且有助于它的发现与获取的数据[1]。吴开华[2]等人在其论文中提及在哈佛大学数字图书馆项目中其定义为:“元数据是帮助查找、存取、使用和管理信息资源的信息”。通过这些定义,我们清楚地认识到元数据是网络信息资源描述的重要工具,可以用于网络信息资源管理的各个方面,包括信息资源的建立、发布、转换、使用和共享等。元数据功能可以概括为五个方面:(1)描述:是元数据的基本功能,主要是对信息对象和位置进行描述,从而为信息对象的存取与利用奠定必要的基础。(2)定位:元数据包含有关网络信息资源位置方面的信息,可确定资源的位置所在,促进网络环境中信息对象的发现和检索。(3)检索:利用元数据来更好地组织信息对象,建立各信息对象之间的关系,为用户提供多层次、多途径的检索体系。(4)评估:元数据提供有关信息对象的名称、内容、年代、格式和制作者等基本属性,使用户在无需浏览信息对象本身的情况下,就能够对信息对象具备基本了解和认识,参照有关标准即可对其价值进行必要的评估,作为存取利用的参考。(5)选择:支持用户在不浏览信息对象本身的情况下,能够对信息对象有基本的了解和认识,从而决定对检出信息的取舍。
2.2 元数据标准化
2.2.1 元数据标准定义和内容
元数据标准是描述某类资源的具体对象时所有规则的集合。不同类型的行业或资源具有不同的元数据要素。元数据内容标准一般包括描述一个具体对象时所需的数据项集合、著录规则、各项数据语义定义和计算机应用时的语法规定等,通常包括标识信息、数据质量信息、内容信息、发行信息、元数据参考信息和联系信息等要素元数据。元数据标准是从数据集抽取元数据时为正确使用这些数据集而应遵循的准则,是数据共享的前提和提高数据共享应用系统综合效益的基础,因而建立行业性的元数据标准非常必要。
元数据通常是按元素、实体及子集进行组织的,元素是元数据的基本单元,用于描述数据集某一具体的特征;实体是描述同类特征的元数据元素和其它元数据实体的集合;子集是相互关联的元数据实体和元素的集合。元数据标准一般采用数据字典与统一建模语言(Unified Modeling Language,UML)相结合的表达方式来描述元数据的内容和结构[3]。数据字典用于对元数据的实体和元素进行详细定义,典型产品的数据字典包括7个主要属性:中文名称、英文名称、标记、定义、数据类型、值域、约束/条件和最大出现次数,其中“约束/条件”属性为元数据实体或元素的选择条件的描述符,包括必选、一定条件下必选和可选[4]。
2.2.2 国外元数据标准研究现状
元数据的标准化建设关系到信息发现、资源共享,是有效利用信息资源的保障。为此,国内外信息组织纷纷开展此方面的研究,并取得了阶段性的进展。目前,国内外发展较为成熟、应用较为广泛的元数据标准有以下几个典型标准[5]:
(1)由美国国家信息化标准组织提议的都柏林核心元数据标准(dublin core metadata element set,DC),是经美国国家标准学会批准通过的具有代表性的标准,目前已有澳大利亚、丹麦、芬兰、英国、加拿大和新西兰等6个国家采用,广泛应用于信息资源的发掘和存取管理工作中[6]。DC元数据包括:题名、主题、描述、来源、语言、关联和覆盖范围,和描述知识产权方面的创作者、出版者、其他参与者和权限管理,以及描述资源外部属性的日期、类型、格式和标识等。DC元数据还增加了语言、模式和类型3种限定词。
(2)英国研究支持图书馆计划(research support libraries programme,RSLP)资助项目资源集合描述标准,目标是使得 RSLP 资助的所有项目能够以一种一致且机器可读的方式描述资源集合描述模型,并由三个元素区构成的描述资源集合的元数据的收集及管理应用。
(3)生态学元数据语言(ecological metadata language,EML)是一个服务于生态学科的元数据标准,是以美国生态学会为基础开发出来的,旨在提供1套用来描述与生态学有关的数据的高质量元数据规范。
(4)国际标准化地理信息技术委员会(ISO/TC 211) 工作范围为数字地理信息领域标准化,发布的元数据标准确定了两级元数据:一级元数据是编目信息包含数据集编目所需的最少的元数据内容;二级元数据参照美国联邦地理数据委员会(federal geographic data committee,FGDC)下属的元数据工作组制订的原则规范,包含8个子集和3个可重复的实体,FGDC标准目的是确定一个描述数字地理空间数据的术语及其定义集合,包括满足这些目的的数据元素、复合元素(一组数据元素)、定义和域值,以及描述数字地理空间数据集的元数据信息内容。
(5)气象领域元数据 (Climate Forecast,CF) 侧重于描述数据处理和数据展示, 如数据的物理描述和优先处理过程, 以及描述数据的时空属性和坐标体系等信息, 对通常元数据发挥的数据发现功能要求不高。在数据发现方面,CF只提供基本的描述,例如记录数据产生的文件的位置和数据产生方法。
3 照明产品核心元数据标准化
3.1 内涵及作用
照明产品核心元数据是对照明产品数据的描述性信息,主要包括产品基本信息、产品发布信息、产品价格信息、产品分类信息、产品生产信息和技术参数信息等方面具有特征的描述信息。照明产品核心元数据的目的是方便用户使用照明产品主体数据、实现数据规范共享,已从简单地描述或索引发展为用于管理数据、发现数据、使用数据的一种重要工具和手段。其作用包括:
(1)数据生产者利用元数据对生产的照明产品数据进行详细说明。
(2)数据使用者利用元数据了解所需照明产品数据的基本特征,从而决定是否使用及如何有效地使用该数据。
(3)网上发布元数据可以使用户对照明产品数据发现、检索和重复使用变得容易,能更好地确定照明产品数据位置,以及访问、评价和购买照明产品数据。
3.2 核心元数据设计
(1)设计原则:照明产品核心元数据设计的建立是充分尊重所描述的文献资源,尽可能地满足查阅者的需求,参考与借鉴国际上特定领域内主流的标准和较为成熟的元数据方案,支持资源的长期保存和有效利用。在这种设计思想的指导下,照明产品核心元数据的设计是在把握其特点的基础上遵循通用原则予以标准化,设计原则如图1所示。
图1 照明产品核心元数据设计原则
(2)设计流程:① 资源分析:明确要描述的资源对像,界定范围及分析照明产品资源特点。并且要调查照明产品信息管理者和使用者对元数据应用的需求。② 相关标准调研:收集相关元素据标准,分析元数据内容并判断在结构上是否可以借鉴,通用性元素是否可借鉴应用。③ 建立框架:根据各种照明产品相互之间的关系和规则,建立整体元数据框架。④ 属性提取:咨询照明行业专家意见,参照照明产品的标准和文献,从资源利用的角度提出属性需求要素。⑤ 限定规则和著录规则:规定照明产品元数据的限定原则(修饰词、编码体系及修饰词),并制定详细的数据著录规则和指导意见。
3.3 行业调研及标准立项
照明产品核心元数据标准是对照明产品元数据的规范化,照明产品数据共享困难、无法交换、不能整合、难以发现及不能获取的现状,直接影响用户对数据的判断。在我国,产品元数据标准由全国信息分类与编码标准化技术委员会(SAC/TC 353)归口管理,目前已立项产品核心元数据系列标准的多项国家标准。深圳市标准技术研究院(Shenzhen Institute of Standards and Technology,SIST)基于对照明行业的前期调研,包括国际贸易中针对照明产品相关标准和信息的收集,以及国外主要发达国家照明产品类别相关标准化和信息情况,并借助广东省照明产业集聚的特有优势对照明产品生产企业进行问卷和走访相结合的调研,了解我国照明产品类别核心元数据的标准化需求。在调研与研究相结合的基础工作上,SIST向SAC/TC 353秘书处汇报了照明产品核心元数据标准化工作情况及立项设想,《全国主要产品分类 产品类别核心元数据 第3部分 照明产品》国家标准获得批准立项。
3.4 标准制定
SIST组建的标准编写工作组通过研究及调研照明产品核心元数据相关标准化情况,该标准规定了产品信息管理中照明产品核心元数据的统一建模语言描述和字典描述,适用于产品信息管理中对照明产品信息的描述、编码、建库、查询和发布。标准起草工作组通过调研数据的汇总及研究,排除例如蜡烛和煤油灯等非电光源类产品的归属,确定了该标准的范围将涵盖GB/T 7635.1-2002《全国主要产品分类与代码 第1部分 可运输产品》中“465白炽灯泡或放电灯、弧光灯及其附件、照明设备及其附件”类照明产品,基于GB/T 7635.1标准滞后的因素,将具有高效节能的LED照明产品纳入该标准的涵盖范围。并从制造商和消费者的角度去明确描述照明产品核心元数据的基本要求,在标准征集意见过程得到了深圳市LED产业标准联盟(LED Standards Alliance of Shenzhen,LSA)专家委员会的大力支持,通过多次组织LSA专家进行标准文本的讨论,使照明产品核心元数据标准得到了更好的完善与修订。预计该标准的批准与实施将对照明产品的管理和利用产生深远的影响。标准中规定照明产品的核心元数据主要由产品基本信息、产品发布信息、产品价格信息、产品分类信息、产品生产信息和技术参数信息6个元数据实体。并采用表1所列9个属性来描述数据元素。
表1 照明产品核心元数据标准元素属性
属性名称 |
说明 |
中文名称 |
元素中文名称 |
英文名称 |
元素英文名称 |
标记 |
用字符串表示的元素标记 |
定义 |
对元素含义的解释 |
数据类型 |
元素所属的数据类型 |
值域 |
元素值的允许范围 |
约束/条件 |
元素是必选元素还是可选元素 |
最大出现次数 |
元素所允许的著录次数 |
备注 |
对元素的补充说明、格式建议及其他 |
3.5 标准化问题及建议
在照明产品核心元数据标准制定的过程中,遵循查找照明产品数据的需求, 立足阐述有什么数据、数据怎么样、如何组织、如何获取、怎么使用和与之相关的其他数据如何等基准,明确照明产品核心元数据内容应包括数据集基本信息描述、数据内容描述、数据质量描述、使用限制描述和数据分发,以及与数据相关的其他信息描述。虽然我们在标准制定过程发现照明产品核心元数据标准信息丰富,但在实际应用中会存在两种情况的不足。一种情况是用户很容易检索到元数据, 但难以理解元数据内容,更难以通过元数据认知照明产品的信息,进而无法评价和选择数据。
另一种情况是用户很容易理解元数据的内容, 但用户最为关注的数据属性描述却没有在元数据内容上体现出来, 或者元数据对该属性的描述力度不够, 导致用户无法通过元数据内容评价和选择数据。笔者认为这些问题的解决需要从两个方面考虑,一是照明产品核心元数据的描述必须要抓住照明产品的数据属性。另一方面是照明产品核心元数据的内容完善标准需从使用者的角度考虑。研究用户查找数据的行为, 分析用户对元数据的关注点所在(需求分析),在此基础上对元数据内容进行准确的完善,并明确哪些描述项不可或缺,哪些描述项可有可无,以制定用户认可并易于理解的数据元数据。
4 照明产品核心元数据标准应用展望
照明产品核心元数据标准应从决策者和管理者的角度,利用各种可能的方式进行推广和应用,让各级照明产品工作者习惯于使用这个标准对照明产品信息资源进行著录,从而建立起完整的照明产品信息资源著录信息数据库。同时可以制定相应的政策法规,从政策上鼓励照明产品工作者使用这套标准,并利用照明产品核心元数据著录信息管理系统对自己的科技信息资源进行著录,从政策上保障著录用户免费使用相应信息的权利,为建立照明产品信息资源著录信息库奠定政策基础。
基于照明产品核心元数据标准的照明产品信息核心元数据著录信息管理系统的推广与应用,应建立起庞大的照明产品信息资源著录信息库,基于这个信息库,可以开发出更多的增值服务,如照明产品信息资源挖掘、照明产品发展分析预测等。有关单位、用户可以按照扩展机制所约定的规则和方法,根据自己的需求对其进行扩展应用。因此,照明产品核心元数据标准的推广应用具有极为广阔的市场前景。
5 结语
核心元数据标准体系的建设是目前信息资源基础建设的重要工作之一,也是一项迫在眉睫的基础标准化工作。照明产品核心元数据标准的报批与发布,不仅能够使照明产品信息资源的管理、利用水平上升到一个新的起点,而且为我国照明产品服务体系的建设打下坚实的基础。同时也应该看到,照明产品核心元数据库的建设需要该领域的专家、元数据研究人员和计算机工程师分工与协作,需要耗费人力、物力和财力建立一个完整的、可用的照明产品核心元数据标准体系。为了更好地推动该标准体系的实施,应建立相应的激励机制和控制程序,保证元数据收集的顺利进行,完善照明产品元数据库的建设,为网上管理、查询和使用照明产品元数据与信息服务起到关键作用,在不同层面对照明产品的检索、整合、交换及其它应用提供相应的服务。
参考文献
[1] 钱平, 苏晓鹭, 崔运鹏. 农业科技信息核心元数据标准的研究[J]. 农业网络信息, 2006(2):18-21.
[2] 吴开华, 邢春晓, 罗德胤. 数字图书馆元数据研究[J]. 中国图书馆学报, 2002, 28(3):43-46.
[3] 中国气象局.QX/T 39-2005气象数据集核心元数据[S].北京:中国标准出版社,2006.
[4] 冯文灏. 近景摄影测量[M]. 武汉大学出版社, 2002.
[5] 赵华, 王健. 国内外科学数据元数据标准及内容分析[J]. 情报探索, 2015(2):21-24.
[6] 罗伯特 布兰德,曹映芬.ANSI通过都柏林元数据Z39.85-2001标准[J].情报资料工作,2002(04):79-65.
作者简介:曹小兵,高级工程师,《中国照明电器》期刊编委会委员,全国照明电器标准化技术委员会灯具分技术委员会(SAC/ TC224/SC2)委员,全国标准化原理与方法标准化技术委员会标准化评价分技术委员会(SAC/TC286/SC1) 委员,全国城市公共设施服务标准化技术委员会(SAC/TC537)委员,广东省质监局工程系列标准化专业高级评审委员会评委,广东省网络空间安全标准化技术委员会(GD/TC124)专家委员会专家,主要从事智能照明技术及其标准化研究。