维普资讯 http://www.cqvip.com
2006年6月 林业资源管理 June.2006 第3期 F0REST RESOUR(、ES M【ANAGEM匮NT NO.3 森林资源非空间数据的加工整合技术探讨 李春明,张会儒 (中国林科院资源信息研究所,北京100091) 摘要:介绍了森林资源非空间数据所包含的主要内容。从数据的分类和编辑处理,数据标准化、数据检查和质量 控制等角度探讨了森林资源非空间数据的加工处理方法。对进一步加强我国森林资源非空间数据的加工整合及 共享提出了建议。 关键词:森林资源;信息共享;非空间数据;加工整合 中图分类号:rrP31;S'/57.2 文献标识码:A文章编号:1002—6622(2006)03—0089—05 Discussion on Techniques of Processing and Integrating of Forest Resource Non。——spatial Data LI Chunming,ZHANG Huiru (Research Institute ofForestRemumes Information Technique,CAF,Beijing 100091,China) Abstract:The paper introduced the main contents of forest resource non—spatial data.The questions on classifying and editing of data,standards of data,checking and quality controlling of data were dis— cussed.Some suggestions were presented for strengthening processing,integrating and sharing of for— est resource non—spatial data in China. Key words:forest resources,information sharing,non—spatial data,processing and integrating 森林资源信息按照空问属性可分为非空间信息 科学数据的综合性信息。由于林业的特殊背景,这 和空间信息。非空间信息通常以表格或文字的形式 些非空问数据存在着各种问题,还难以满足共享的 表示,空问信息通常以图件的形式表示。森林资源 要求。一方面,这些数据大多以各种文字、小班卡片 非空间数据库的建设是森林资源信息共享的一项基 和统计报表等形式保存,只有很少一部分建成了数 础工程,对于决策、科学研究和林业生产具有举 据库形式,并且分散于林业行业的各个部门,已影响 足轻重的作用。新中国成立以来,我国在林业领域 了其作用的充分发挥。另一方面,由于森林资源的 开展了不同程度、规模不等的森林资源监测、调查和 许多要素随着时问而不断变化,而且每一次新的调 试验研究,特别是通过三种森林资源调查和专题研 查都增加了新的内容,这些数据对于建立序列森林 究,积累了大批的森林资源非空问数据和基于这些 资源非空间数据库并分析森林资源的动态变化是很 收稿日期:2005—11—15;修回日期:2006—02—2l 基金项目:国家科技基础平台项目“林业科学数据中心试点项目”的子课题“森林资源数据库建设及共享 (2004DKA20210—1)”;国家林业局“遥感与信息系统重点实验室”资助。 作者简介:李春明(1975一),男,河北承德人,助理研究员,硕士,从事森林资源管理与决策研究。 维普资讯 http://www.cqvip.com
林业资源管理 第3期 宝贵的,这就需要数据库结构能动态的更新u1 。目 前,已建的一些数据库由于当时目标所限,信息的分 类和编码自成体系,有关的数据没有进行有效的整 合,数据内容不够完整,造成有些数据无法进行一体 化管理和应用。因此要求采用相应的信息技术将这 些数据进行收集、加工整合,并将其变成标准的数据 库形式,建立数据交换中心,实现森林资源非空间信 息的共享。 I森林资源非空间信息的内容 目前,我国森林资源非空间数据主要来源于三 种森林资源调查和专题科学研究。因此,根据其来 源分类的数据类别及内容见表1 。 表1森林资源非空间数据的类别及内容 在森林资源非空间数据中,样地调查数据、小班 调查数据和森林资源统计数据是三种调查的主要产 出成果,在科学研究中有极其重要的作用。 I.I样地调查数据 样地数据主要有样地连续观测和专题研究临时 样地观测数据两种。前者是以全国、省、自治区、直 辖市为基本调查单元进行调查的。一般均为固定样 地,调查的主要内容包括样地坐标、样地类别、样地 面积、优势树种、起源、林龄、平均直径、平均树高、优 势高、郁闭度、坡度、坡向、坡位、土壤类型、下木及幼 树等内容。后者是由于生产或科研的需要在某一森 林类型的林分内l临时设置的样地,在样地内对各个 林分因子进行调查和观测,由于调查目的和内容不 同,没有统一的标准。 I.2小班调查数据 小班调查数据主要是林业生产单位进行小班调 查时获得的,是林业生产单位制定规划设计的依 据|3 J。调查的主要内容包括小班地况调查和小班林 况调查。小班地况调查的项目包括小班的地类、坡 度、坡向、海拔、土壤种类、土层厚度以及有无冲刷现 象等。小班林况调查的项目主要有林分起源、林层 结构、树种组成、林龄、立地质量等级、疏密度、林分 蓄积量、林分出材率、林种、林木生长情况、更新情 况、特用植物情况、森林动植物情况、灾害及卫生情 况等内容。 I.3森林资源统计数据 森林资源统计数据主要是通过一类调查或二类 调查获得的。一类调查是以全国、省、自治区、直辖 市为单位组织的,调查的主要内容包括森林资源的 面积、蓄积,各林种及各森林类型的生长、枯损、更新 及采伐等。所汇总的统计表主要包括森林资源概况 表、林业用地各类土地面积统计表、森林资源面积蓄 积统计表、森林资源按权属统计表、林分各林种各龄 组面积蓄积统计表、天然林资源统计表、天然林各林 种各龄组面积蓄积统计表、人工林资源统计表、人工 林各林种各龄组面积蓄积统计表、经济林面积统计 表和竹林面积株数统计表等。二类调查是以县或林 业局为单位组织的,调查的主要内容包括各地类小 班的面积、蓄积、生长量和枯损量、立地条件、生态条 件以及有关自然、历史、经济、经营等条件的专业调 查等。所汇总的统计表主要包括生态公益林统计 表、林业用地各类土地面积统计表、森林资源面积蓄 积统计表、林种统计表、红树林资源统计表、乔木林 面积蓄积按龄组统计表、用材林近成过熟林面积蓄 积按可及度及出材等级表、用材林近成过熟林各树 种株数、材积按径级组、林木质量统计表、用材林与 一般公益林中异龄林面积蓄积按大径木比等级统计 表、用材林面积蓄积按龄组统计表、灌木林统计表、 竹林统计表和经济林统计表等。 2森林资源非空间信息的加工整合技术要点 一个科学完善的森林资源非空间数据加工整合 流程对于保证数据的质量,加快共享的步伐起到了 维普资讯 http://www.cqvip.com
第3期 李春明等:森林资源非空间数据的加工整合技术探讨 91 决定性的作用。根据经验,适合森林资源非空间数 据集成及共享的数据加工整合流程如图1所示。 森林资源非空间数据科学需求分析 森林资源非空间数据的搜集 纸制统计表形式 I小班卡片形式 数据库软件选择 l各种数据库形式 二二[二二[不 △ 口 森林资源非空间信息整合标准规范 数据分类和录入 数据编辑和处理 格 数据的标准化处理卜I 据检查和质量控 —\—/ l合 格 数据提交 图1森林资源非空间数据/jam整合流程 2.1数据的分类和编辑处理 由于森林资源非空间数据来源多样,在调查方 法、调查时间和统计方法方面存在差异,造成这些数 据在内容和格式上标准不一,另外在数据录入后会 数据的整合和共享带来一定的困难 J。数据在录入 后,就要将这些非空间信息按一定的规律进行分类 和编码,将它们有机的进行组织,有效的存储和管 理。按照唯一性、简单性、可扩展性、规范性和适用 性等原则 ,将森林资源非空间数据分为地类、林 种、林分因子、单株林木数据、森林环境数据、人工造 林措施数据、森林经营措施数据、林分动态变化因子 数据、森林权属因子数据、森林主要植物种数据、森 林类型数据及其它数据(收容类)12个大类。采用 层次编码与顺序编码相结合的方法,用两位数字作 为类标识码,并在此基础上进行编码【2]。 存在很多错误,还不能够直接满足共享的要求,因此 要对数据进行分类和编辑处理。分类的主要依据是 根据数据的表现形式和内容、调查方法及数据来源 等角度进行归并。数据的编辑处理工作主要包括数 据各种错误修改;数据格式转换;多时间、多类别数 据的集成;元数据和数据字典的编写;数据技术文档 的编写等。 2.2标准化处理 2.2.2森林资源非空间数据库的标准化 一为便于森林资源非空间信息的共享,以及不同 系统之间进行访问和交互,数据在编辑处理后要进 行标准化处理。标准化处理的主要工作包括非空问 数据的分类和编码标准化、数据库结构的标准化、数 据字典和元数据标准化等等。 2.2.1森林资源非空间数据的分类和编码 由于森林资源非空间信息数据种类繁多,内容 丰富,在概念、单位、分级等方面存在着一定差别,给 个理想的数据库至少应保证信息在一定层次 上的共享,方便交互和访问。同时既要满足墩历次 森林资源非空间数据的分析,又要达到规范后续数 据的目的。因此,为了使森林资源非空间信息得到 更深人的利用,实现数据的共享,必须对数据库结构 做出标准化的科学设计。在进行森林资源非空间数 据的数据库结构设计时,主要考虑概念结构设计、逻 辑结构设计和物理结构设计等三方面的内容【6 J。概 维普资讯 http://www.cqvip.com
林业资源管理 第3期 念结构设计包括森林资源数据库中数据的数据命 名,数据表中字段名称、类型及长度的标准化。逻辑 结构设计包括数据表之问的逻辑关系以及数据表中 字段之间的逻辑关系等。 2.2.3数据字典和元数据的标准化 元数据是关于数据内容、质量、状况和其他有关 特征的背景信息的简要介绍,是信息资源有效管理 和应用的重要手段 J。在建立科学的森林资源非空 间元数据时,主要包括数据库的中英文名称、数据库 内容的简要说明、负责单位信息、数据范围、数据库 语言、信息、数据志说明、数据质量说明、数据表 示类型、数据项、发行信息、元数据参考信息等内容。 数据字典是数据库应用系统中所有数据的详尽描 述,是一种数据分析、系统设计和管理的工具。非空 问数据的数据字典包括数据库说明、数据表说明和 字段说明三部分。其中数据库说明包括数据库中英 文名称、数据库含义、存储格式、更新日期、包含的数 据表数、数据字典填写人和填写单位信息等内容。 数据表说明包括数据表中英文名称、数据表内容说 明、所属数据库以及所包括的字段个数等信息。字 段说明包括字段所属数据库和数据表名称、字段名 称和含义、字段类型、字段长度、字段精度等内容。 2.3数据检查和质量控制 森林资源非空间数据是以大量的外业调查数据 作为基础的,这些数据在外业填写时很难保证不出 错误。数据在内业汇总时会发生数据的统计错误。 数据在录人后,由于数据录人人员的疏忽,会发生数 据录人错误、记录值丢失、记录值超界、记录值逻辑 错误等 J。不同格式的数据库,由于项目的需要,要 转换成统一的数据库格式,可能会发生数据丢失、数 据逻辑关系错误、字段定义、长度和类型发生变化 等。这就要求数据检查和质量控制人员对数据要进 行质量控制。它是森林资源非空间数据人库和共享 之前必不可少的一项工作内容,是数据质量的重要 保证。以数据的规范性、完整性、正确性为检查原 则,采取三种质量控制方法对数据的定义和组织、数 据精度进行质量控制。首先采取人工比对法,对录 人前和录人后的数据进行直接的比对,发现其不一 致性,通知相关人员进行纠正。其次运用智能检错 法,即为了自动化地检查数据的质量,提高检查的速 度,程序员编写智能化检错系统,对出现错误的数据 进行智能检测,并将发生错误的信息存在特定的数 据库中,当检查完毕后,输出检错报告,通知相关人 员进行纠正。另外还有统计分析法,也就是为了更 加全面地从总体上检查数据的质量,对新旧数据以 及同一数据库不同数据表中数据的正确程度进行量 化的统计分析,发现其在某个统计结果的不一致性, 通知相关人员进行纠正。最后,质量检查和控制人 员还要对加工整理好的数据进行规范性检查,例如 检查文件数量、文件命名、属性项数、字段名称、字段 类型、字段排列顺序、元数据和数据字典与数据库的 一致性等等。 3结语 森林资源非空间数据对于增强我国林业的科技 创新能力、提高林业科技整体水平、促进社会和经济 的发展具有重要意义。但是在森林资源标准规范的 制定、数据检查和控制以及共享方面存在着一些问 题,还不能够完全满足科学研究、决策和林业生 产的需要。需要在以下几个方面作出努力。 1)森林资源非空间数据的标准规范制定工作 有待完善 在森林资源非空间信息的分类编码方面,其完 整性与实用性是一对矛盾。例如在进行树种编码时 如果考虑所有的树种,系统是很完善,但代码长度过 长,非常不利于实际应用;代码长度缩短又无法容纳 全部树种。另外,目前对数据库结构、字段名等项的 定义与规范还不完善,使得原始数据无法直接归并。 随着森林资源非空间数据数量的逐渐增多,目前的 标准规范体系已不能完全满足共享的要求,仍需不 断优化和完善。 2)加强数据检查和质量控制的研究 数据质量的检查和控制是加工和整合数据过程 中十分重要的一环,是数据质量得到保证的关键。 目前的数据质量检查大多还只停留在人工手动去检 查,这种方法不仅费时费力,在检查过程中由于检查 人员的知识水平以及数据本身复杂性的原因,可能 会造成新的错误。有学者在智能检错系统方面作了 维普资讯 http://www.cqvip.com
第3期 李春明等:森林资源非空间数据的加工整合技术探讨 93 深入的研究,但也只限于对于某一类数据的检查 j。 由于森林资源非空间数据获取的复杂性及数据种类 的多样性,目前还没有一个系统的数据质量控制方 法来对森林资源非空间数据进行质量控制。因此对 于质量检查和控制方面的研究已迫在眉睫。 参考文献: [1]柯善新.林业数据库设计与标准化问题探讨[J].中南林业调查 规划,2001,2O(增刊):60—68. [2]张会儒,雷相东.森林资源基础数据技术规范[G].易浩若.林业 科学数据库和数据共享技术标准与规范.北京:中国林业出版 社。2004:44—163. 3)共享机制有待加强 森林资源非空间数据的共享工作已经取得了很 大的进展,但在共享的意识和共享环境整合方面,仍 然面临着一系列的问题。一方面各级领导和业务人 [3]于政中,李海文,亢新刚,等.森林经理学[M].第2版.北京:中 国林业出版社,1991. [4]陆元昌,雷相东,李增元.数字林业信息分类体系与编码研究 [J].林业科技管理,2002(2):22—27. [5]张茂震,宋铁英,唐小明,等.森林资源信息分类编码方法[J].福 建林学院学报,2005,25(2):147—152. 员的共享意识存在问题。由于对信息共享的不正确 观念,存在着严重的信息封闭、信息壁垒和信息垄断 的问题,它是当前实现信息共享的一大障碍。另一 方面缺乏一个支撑交换和共享的体系以及配套的政 [6]夏明盛.数据库系统在森林资源档案管理中的应用[J].林业资 源管理,2003(3):61—64 [7]王晓慧,鞠洪波.森林资源数据库的改造与共享[J].林业科技通 讯,2000(5):15—16 策法规和管理思路。随着信息技术的发展,信息资 源共享问题已经得到了各个层面的共识,相信不久 这方面的问题会得到解决。 [8]王志西,林洪,宗有生,等.智能检错在森林资源数据 总中的 应用[J].林业勘查设计,1996(4):64—68. (上接第50页) 林场,为避免林分土壤地力过度衰退,并维持华北落 2)水分是半干旱地区华北落叶松人工林存活 叶松人工林林分在干旱年份的存活,其合理密度宜 控制在郁闭度0.6~0.7为宜。 参考文献: . 和生长的性因子,如果其群落密度过高(郁闭度 在0.8以上),耗水量巨大,水分严重失衡,在早年就 会造成林分成片死亡。即使在平水年,华北落叶松 人工林的密度也不宜过大,否则会造成华北落叶松 [1]沈国舫.森林培育学[M].北京:中国林业出版社,2001. [2]张光灿.黄土半干旱区集水造林水分环境容量研究[D].北京林 业大学博士论文,2000 [3]翟洪波.中国水力结构研究进展[M]北京:中国农业科技出版 社。2005. 林分生长缓慢、树势减弱、稳定性降低,诱发各种病 虫危害。 3)定量研究结果表明,在塞罕坝机械林场的平 水年,随着华北落叶松人工林林分郁闭度(密度)的 增加,林分40cm土层的土壤含水量呈减少的趋势。 特别是在7月份,当郁闭度0.6和0.8的林分其 40cm土壤含水量为5%以上时,郁闭度1.0的林 [4]Tyree M T,Zimmermann M H.The theory and practice of mea— suring trnsporta coefficient and sap flow in the xylem of red maple stems(Acer mbmm)[J].Journal of Experimental Botny,1971.a 22:l—l8. 分,其40cm土层的土壤含水量已低至4.0%以下, 部分林木开始出现旱死现象。 4)随着华北落叶松人工林郁闭度(密度)的增 加,林下土壤酸化加剧,林分对土壤有机质、速效氮、 速效磷和速效钾的消耗,特别是对速效氮的消耗明 显增加,土壤退化趋于严重。 5)综合定性和定量的研究结果,在塞罕坝机械 [5]李占跃,翟洪波.木本植物水力结构与抗早性[J]应用, 念学 报,2000,11(2):301—305. [6]翟洪波,李吉跃.SPAC中油松栓皮栎混交林水分特征 气体交 换[J].北京林业大学学撤,2004,26(1):30—34. [7]徐成立,翟洪波,李吉跃,等.油松栓皮栎混交林林分合理密度 探讨[J].东北林业大学学报,2005,33(增刊):23—25. [8]潘湘海.塞罕坝华北落叶松人工林土壤水分的研究[J]河北林 业科技,2002(5):7.