CORC  > 寒区旱区环境与工程研究所  > 研究生学位论文  > 学位论文
题名中国冰川目录多维数据分析模型的建立和应用
作者郭学军
学位类别博士
答辩日期2005
授予单位中国科学院寒区旱区环境与工程研究所
授予地点中国科学院寒区旱区环境与工程研究所
导师姚檀栋
关键词中国冰川目录 联机分析处理 数据立方体 数据挖掘
其他题名The Multi-Dimensional Data Model and Its Applications of Chinese Glacier Inventory
中文摘要中国是中低纬度地区山地冰川最为发育的国家,为了对中国境内的冰川资源数量和区域分布等情况进行详细的统计和计算,我国的科技人员历经20余年的工作于2002年完成了中国冰川目录的编撰工作。根据最新的统计(纠正了部分检测到的错误数据),中国境内共发育冰川46377条,总面积达59425km2,冰储量5616km3。中国冰川目录数据包含每条冰川的地理位置、长度、宽度、高度、面积和资料来源等属性。基于结构化查询语言SQL的关系数据库系统是针对联机事务处理系统设计的,因此,在数据的复杂查询和分析方面显得无能为力。20世纪90年代出现的数据仓库、联机分析处理技术和数据挖掘技术是基于分析型环境建立的。数据仓库、联机分析处理和数据挖掘是商业智能系统(决策支持系统)的三个有机组成部分,商业智能在商业领域已经得到了广泛的应用,并取得了巨大的成功。本文把商业智能的思想和方法应用到科研数据的分析过程之中,在中国冰川目录数据库的基础上建立了基于三层体系结构的中国冰川目录的多维数据模型和基于Web的信息发布系统。通过建立在联机分析处理服务器上的多维数据模型-数据立方体,科研人员能够通过应用服务器通过Web的方式查询和分析多维数据,并结合决策树分类挖掘模型和人口统计学聚类挖掘模型可以对中国冰川目录的数据进行了深层次的探索和分析。本研究的主要内容和结果如下:1、数据预处理:在建立多维分析模型之前,为了提高分析的质量,对原始数据进行了预处理。在预处理阶段,识别出的垃圾数据约占10%以上,并存在18%的空值数据。本文对识别到的垃圾数据和空值数据,利用数据清理、数据转换等多种预处理方法对这些垃圾数据进行了纠正并对部分空值数据进行了补充,提高了中国冰川目录原始数据的质量。2、多维数据模型的建立:采用星型模型和MOLAP存储方式建立了冰川相关14个纬度5个多维数据集(数据立方体),涉及的度量包括冰川数量、冰川面积、冰储量、雪线高度、海拔高度、冰力f长度与宽度、冰川厚度等。这5个数据立方体基本覆盖了冰川目录中包含的绝大部分与冰川分析相关的属性。3、多维数据集的发布:采用目前流行的Browser/Server三层结构建立了I中国冰川目录多维数据集的发布系统,科研人员利用Web浏览器即可进行执行各种复杂的多维分析动作,极大程度上提高了数据的使用和分析效率。通过查询和分析多维数据集,科研人员对相关数据进行定性和定量的分析。4、通过对中国冰川目录数据的多维分析,结合数据挖掘技术对中国冰川资源的总体分布特征、雪线分布特征、类型分布特征等进行了全方位的分析并获得下面的主要结论:.山体高度能否达到6000m是影响冰川资源分布的分界线,以6000m为界,冰川作用差、规模、数量、面积和储量等呈现不同的分布特征.冰川作用上限、冰舌末端海拔和雪线高度等的纬向分布显示35°N左右为界线的相反变化特征,因此印度季风对青藏高原冰川分布的纬向特征有重要影响。在35°N以南,随着向印度洋的逼近,印度季风的作用越来越强,呈现出冰川雪线、冰川作用上限和冰舌末端海拔越向南越降低的变化特征。同时也出现了在35°N度以南南坡冰川雪线低于北坡的独特现象,在35°N以北印度季风的影响不再明显,雪线等的分布重新受地理分异规律的影响而呈向北逐渐降低的特征。.青藏高原的雪线呈不规则椭圆状分布,青藏高原腹地雪线高度呈现东西两个南北向的鞍形分布和两个最高雪线分布中心,该特征体现了季风和地形因素对青藏高原雪线分布的影响。
语种中文
公开日期2013-08-22
页码115
内容类型学位论文
源URL[http://ir.casnw.net/handle/362004/22081]  
专题寒区旱区环境与工程研究所_研究生学位论文_学位论文
推荐引用方式
GB/T 7714
郭学军. 中国冰川目录多维数据分析模型的建立和应用[D]. 中国科学院寒区旱区环境与工程研究所. 中国科学院寒区旱区环境与工程研究所. 2005.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace