新网创想网站建设,新征程启航
为企业提供网站建设、域名注册、服务器等服务
引言
公司主营业务:成都网站设计、做网站、移动网站开发等业务。帮助企业客户真正实现互联网宣传,提高企业的竞争能力。创新互联建站是一支青春激扬、勤奋敬业、活力青春激扬、勤奋敬业、活力澎湃、和谐高效的团队。公司秉承以“开放、自由、严谨、自律”为核心的企业文化,感谢他们对我们的高要求,感谢他们从不同领域给我们带来的挑战,让我们激情的团队有机会用头脑与智慧不断的给客户带来惊喜。创新互联建站推出宿豫免费做网站回馈大家。
地理信息系统(Geographic Information System,简称GIS)是计算机科学、地理学、测量学、地图学等多门学科综合的技术[1]。GIS的基本技术是空间数据库、地图可视化及空间分析,而空间数据库是GIS的关键。空间数据挖掘技术作为当前数据库技术最活跃的分支与知识获取手段,在GIS中的应用推动着GIS朝智能化和集成化的方向发展。
1 空间数据库与空间数据挖掘技术的特点
随着数据库技术的不断发展和数据库管理系统的广泛应用,数据库中存储的数据量也在急剧增大,在这些海量数据的背后隐藏了很多具有决策意义的信息。但是,现今数据库的大多数应用仍然停留在查询、检索阶段,数据库中隐藏的丰富的知识远远没有得到充分的发掘和利用,数据库中数据的急剧增长和人们对数据库处理和理解的困难形成了强烈的反差,导致“人们被数据淹没,但却饥饿于知识”的现象。
空间数据库(数据仓库)中的空间数据除了其显式信息外,还具有丰富的隐含信息,如数字高程模型〔DEM或TIN〕,除了载荷高程信息外,还隐含了地质岩性与构造方面的信息;植物的种类是显式信息,但其中还隐含了气候的水平地带性和垂直地带性的信息,等等。这些隐含的信息只有通过数据挖掘才能显示出来。空间数据挖掘(Spatial Data Mining,简称SDM),或者称为从空间数据库中发现知识,是为了解决空间数据海量特性而扩展的一个新的数据挖掘的研究分支,是指从空间数据库中提取隐含的、用户感兴趣的空间或非空间的模式和普遍特征的过程[2]。由于SDM的对象主要是空间数据库,而空间数据库中不仅存储了空间事物或对象的几何数据、属性数据,而且存储了空间事物或对象之间的图形空间关系,因此其处理方法有别于一般的数据挖掘方法。SDM与传统的地学数据分析方法的本质区别在于SDM是在没有明确假设的前提下去挖掘信息、发现知识,挖掘出的知识应具有事先未知、有效和可实用3个特征。
空间数据挖掘技术需要综合数据挖掘技术与空间数据库技术,它可用于对空间数据的理解,对空间关系和空间与非空间关系的发现、空间知识库的构造以及空间数据库的重组和查询的优化等。
2 空间数据挖掘技术的主要方法及特点
常用的空间数据挖掘技术包括:序列分析、分类分析、预测、聚类分析、关联规则分析、时间序列分析、粗集方法及云理论等。本文从挖掘任务和挖掘方法的角度,着重介绍了分类分析、聚类分析和关联规则分析三种常用的重要的方法。
2.1、分类分析
分类在数据挖掘中是一项非常重要的任务,目前在商业上应用最多。分类的目的是学会一个分类函数或分类模型(也常常称作分类器),该模型能把数据库中的数据项映射到给定类别中的某一个。分类和我们熟知的回归方法都可用于预测,两者的目的都是从历史数据纪录中自动推导出对给定数据的推广描述,从而能对未来数据进行预测。和回归方法不同的是,分类的输出是离散的类别值,而回归的输出则是连续的数值。二者常表现为一棵决策树,根据数据值从树根开始搜索,沿着数据满足的分支往上走,走到树叶就能确定类别。空间分类的规则实质是对给定数据对象集的抽象和概括,可用宏元组表示。
要构造分类器,需要有一个训练样本数据集作为输入。训练集由一组数据库记录或元组构成,每个元组是一个由特征(又称属性)值组成的特征向量,此外,训练样本还有一个类别标记。一个具体样本的形式可为:( v1, v2, ..., vn; c );其中vi表示字段值,c表示类别。
分类器的构造方法有统计方法、机器学习方法、神经网络方法等等。统计方法包括贝叶斯法和非参数法(近邻学习或基于事例的学习),对应的知识表示是判别函数和原型事例。机器学习方法包括决策树法和规则归纳法,前者对应的表示为决策树或判别树,后者则一般为产生式规则。神经网络方法主要是反向传播(Back-Propagation,简称BP)算法,它的模型表示是前向反馈神经网络模型(由代表神经元的节点和代表联接权值的边组成的一种体系结构),BP算法本质上是一种非线性判别函数[3]。另外,最近又兴起了一种新的方法:粗糙集(rough set),其知识表示是产生式规则。
不同的分类器有不同的特点。有三种分类器评价或比较尺度:1) 预测准确度;2) 计算复杂度;3) 模型描述的简洁度。预测准确度是用得最多的一种比较尺度,特别是对于预测型分类任务,目前公认的方法是10番分层交叉验证法。计算复杂度依赖于具体的实现细节和硬件环境,在数据挖掘中,由于操作对象是海量的数据库,因此空间和时间的复杂度问题将是非常重要的一个环节。对于描述型的分类任务,模型描述越简洁越受欢迎。例如,采用规则归纳法表示的分类器构造法就很有用,而神经网络方法产生的结果就难以理解。
另外要注意的是,分类的效果一般和数据的特点有关。有的数据噪声大,有的有缺值, 有的分布稀疏,有的字段或属性间相关性强,有的属性是离散的而有的是连续值或混合式的。目前普遍认为不存在某种方法能适合于各种特点的数据。
分类技术在实际应用非常重要,比如:可以根据房屋的地理位置决定房屋的档次等。
2. 2 聚类分析
聚类是指根据“物以类聚”的原理,将本身没有类别的样本聚集成不同的组,并且对每一个这样的组进行描述的过程。它的目的是使得属于同一个组的样本之间应该彼此相似,而不同组的样本应足够不相似。与分类分析不同,进行聚类前并不知道将要划分成几个组和什么样的组,也不知道根据哪些空间区分规则来定义组。其目的旨在发现空间实体的属性间的函数关系,挖掘的知识用以属性名为变量的数学方程来表示。聚类方法包括统计方法、机器学习方法、神经网络方法和面向数据库的方法。基于聚类分析方法的空间数据挖掘算法包括均值近似算法[4]、CLARANS、BIRCH、DBSCAN等算法。目前,对空间数据聚类分析方法的研究是一个热点。
对于空间数据,利用聚类分析方法,可以根据地理位置以及障碍物的存在情况自动地进行区域划分。例如,根据分布在不同地理位置的ATM机的情况将居民进行区域划分,根据这一信息,可以有效地进行ATM机的设置规划,避免浪费,同时也避免失掉每一个商机。
2.3 关联规则分析
关联规则分析主要用于发现不同事件之间的关联性,即一事物发生时,另一事物也经常发生。关联分析的重点在于快速发现那些有实用价值的关联发生的事件。其主要依据是:事件发生的概率和条件概率应该符合一定的统计意义。空间关联规则的形式是X->Y[S%,C%],其中X、Y是空间或非空间谓词的集合,S%表示规则的支持度,C%表示规则的置信度。空间谓词的形式有3种:表示拓扑结构的谓词、表示空间方向的谓词和表示距离的谓词[5]。各种各样的空间谓词可以构成空间关联规则。如,距离信息(如Close_to(临近)、Far_away(远离))、拓扑关系(Intersect(交)、Overlap(重叠)、Disjoin(分离))和空间方位(如Right_of(右边)、West_of(西边))。实际上大多数算法都是利用空间数据的关联特性改进其分类算法,使得它适合于挖掘空间数据中的相关性,从而可以根据一个空间实体而确定另一个空间实体的地理位置,有利于进行空间位置查询和重建空间实体等。大致算法可描述如下:(1)根据查询要求查找相关的空间数据;(2)利用临近等原则描述空间属性和特定属性;(3)根据最小支持度原则过滤不重要的数据;(4)运用其它手段对数据进一步提纯(如OVERLAY);(5)生成关联规则。
关联规则通常可分为两种:布尔型的关联规则和多值关联规则。多值关联规则比较复杂,一种自然的想法是将它转换为布尔型关联规则,由于空间关联规则的挖掘需要在大量的空间对象中计算多种空间关系,因此其代价是很高的。—种逐步求精的挖掘优化方法可用于空间关联的分析,该方法首先用一种快速的算法粗略地对一个较大的数据集进行一次挖掘,然后在裁减过的数据集上用代价较高的算法进一步改进挖掘的质量。因为其代价非常高,所以空间的关联方法需要进一步的优化。
对于空间数据,利用关联规则分析,可以发现地理位置的关联性。例如,85%的靠近高速公路的大城镇与水相邻,或者发现通常与高尔夫球场相邻的对象是停车场等。
3 空间数据挖掘技术的研究方向
3.1 处理不同类型的数据
绝大多数数据库是关系型的,因此在关系数据库上有效地执行数据挖掘是至关重要的。但是在不同应用领域中存在各种数据和数据库,而且经常包含复杂的数据类型,例如结构数据、复杂对象、事务数据、历史数据等。由于数据类型的多样性和不同的数据挖掘目标,一个数据挖掘系统不可能处理各种数据。因此针对特定的数据类型,需要建立特定的数据挖掘系统。
3.2 数据挖掘算法的有效性和可测性
海量数据库通常有上百个属性和表及数百万个元组。GB数量级数据库已不鲜见,TB数量级数据库已经出现,高维大型数据库不仅增大了搜索空间,也增加了发现错误模式的可能性。因此必须利用领域知识降低维数,除去无关数据,从而提高算法效率。从一个大型空间数据库中抽取知识的算法必须高效、可测量,即数据挖掘算法的运行时间必须可预测,且可接受,指数和多项式复杂性的算法不具有实用价值。但当算法用有限数据为特定模型寻找适当参数时,有时也会导致物超所值,降低效率。
3.3 交互性用户界面
数据挖掘的结果应准确地描述数据挖掘的要求,并易于表达。从不同的角度考察发现的知识,并以不同形式表示,用高层次语言和图形界面表示数据挖掘要求和结果。目前许多知识发现系统和工具缺乏与用户的交互,难以有效利用领域知识。对此可以利用贝叶斯方法和演译数据库本身的演译能力发现知识。
3.4 在多抽象层上交互式挖掘知识
很难预测从数据库中会挖掘出什么样的知识,因此一个高层次的数据挖掘查询应作为进一步探询的线索。交互式挖掘使用户能交互地定义一个数据挖掘要求,深化数据挖掘过程,从不同角度灵活看待多抽象层上的数据挖掘结果。
3.5 从不同数据源挖掘信息
局域网、广域网以及Internet网将多个数据源联成一个大型分布、异构的数据库,从包含不同语义的格式化和非格式化数据中挖掘知识是对数据挖掘的一个挑战。数据挖掘可揭示大型异构数据库中存在的普通查询不能发现的知识。数据库的巨大规模、广泛分布及数据挖掘方法的计算复杂性,要求建立并行分布的数据挖掘。
3.6 私有性和安全性
数据挖掘能从不同角度、不同抽象层上看待数据,这将影响到数据挖掘的私有性和安全性。通过研究数据挖掘导致的数据非法侵入,可改进数据库安全方法,以避免信息泄漏。
3.7 和其它系统的集成
方法、功能单一的发现系统的适用范围必然受到一定的限制。要想在更广泛的领域发现知识,空间数据挖掘系统就应该是数据库、知识库、专家系统、决策支持系统、可视化工具、网络等技术的集成。
4 有待研究的问题
我们虽然在空间数据挖掘技术的研究和应用中取得了很大的成绩,但在一些理论及应用方面仍存在急需解决的问题。
4.1 数据访问的效率和可伸缩性
空间数据的复杂性和数据的大量性,TB数量级的数据库的出现,必然增大发现算法的搜索空间,增加了搜索的盲目性。如何有效的去除与任务无关的数据,降低问题的维数,设计出更加高效的挖掘算法对空间数据挖掘提出了巨大的挑战。
4.2 对当前一些GIS软件缺乏时间属性和静态存储的改进
由于数据挖掘的应用在很大的程度上涉及到时序关系,因此静态的数据存储严重妨碍了数据挖掘的应用。基于图层的计算模式、不同尺度空间数据之间的完全割裂也对空间数据挖掘设置了重重障碍。空间实体与属性数据之间的联系仅仅依赖于标识码,这种一维的连接方式无疑将丢失大量的连接信息,不能有效的表示多维和隐含的内在连接关系,这些都增加了数据挖掘计算的复杂度,极大地增加了数据准备阶段的工作量和人工干预的程度。
4.3 发现模式的精炼
当发现空间很大时会获得大量的结果,尽管有些是无关或没有意义的模式,这时可利用领域的知识进一步精炼发现的模式,从而得到有意义的知识。
在空间数据挖掘技术方面,重要的研究和应用的方向还包括:网络环境上的数据挖掘、栅格矢量一体化的挖掘、不确定性情况下的数据挖掘、分布式环境下的数据挖掘、数据挖掘查询语言和新的高效的挖掘算法等。
5 小结
随着GIS与数据挖掘及相关领域科学研究的不断发展,空间数据挖掘技术在广度和深度上的不断深入,在不久的将来,一个集成了挖掘技术的GIS、GPS、RS集成系统必将朝着智能化、网络化、全球化与大众化的方向发展。
GIS即地理信息系统(Geographic
Information
System),广泛应用于资源调查、环境评估、灾害预测、国土管理、城市规划、邮电通讯、交通运输、军事公安、水利电力、公共设施管理、农林牧业、统计、商业金融等几乎所有领域。
GIS与其他几种信息系统密切相关,但由于其处理和分析地理数据的能力使其与它们相区别。尽管没有什么硬性的和快速的规则来给这些信息系统分类,但下面的讨论可以帮助区分GIS和桌面制图、计算机辅助设计CAD、遥感、DBMS、以及GPS技术。
桌面制图
桌面制图系统用地图来组织数据和用户交互。这种系统的主要目的是产生地图:地图就是数据库。大多数桌面制图系统只有及其有限的数据管理、空间分析以及个性化能力。桌面制图系统在桌面计算机上进行操作,例如PC机,Macintosh以及小型UNIX工作站。
计算机辅助设计CAD
计算机辅助设计(CAD)系统促进了产生建筑物和基本建设的设计和规划。这种设计需要装配固有特征的组件来产生整个结构。这些系统需要一些规则来指明如何装配这些部件,并具有非常有限的分析能力。CAD系统已经扩展可以支持地图设计,但管理和分析大型的地理数据库的工具很有限。
遥感和GPS
遥感是一门使用传感器对地球进行测量的科学和技术,例如,飞机上的照相机,全球定位系统(GPS)接收器,或其他设备。这些传感器以图象的格式收集数据,并为利用、分析和可视化这些图象提供专门的功能。由于它缺乏强大的地理数据管理和分析作用,所以不能叫作真正的GIS。
数据库管理系统
数据库管理系统专门研究如何存储和管理所有类型的数据,其中包括地理数据。DBMS使存储和查找数据最优化,许多GIS为此而依靠它。相对于GIS而言,它们没有分析和可视化的工具。
地理信息系统(Geographic Information System,简称GIS)是20世纪60年代以来随着电子计算机技术的发展及其广泛应用,在地理学中发展起来的一种新的工作手段和方法。该学科是介于信息科学、空间科学和地球科学之间的交叉学科,它是计算机科学、遥感技术、信息工程和现代化地理学理论与方法的有机结合,是它们应用的进一步延伸和发展,是地理学的又一新进展。
一、地理信息与地理信息系统
地理信息是指表征地理系统诸要素的数量、质量、分布特征、相互联系和变化规律的数字、文字、图像和图形等的总称。从地理数据到地理信息的发展,是人类认识地理事物的一次飞跃。地球表面的岩石圈、水圈、大气圈和人类活动等是最大的地理信息源。地理科学的一个重要任务就是迅速地采集到地理空间的几何信息、物理信息和人为信息,并适时地识别、转换、存储、传输、再生成、显示、控制和应用这些信息。
地理信息属于空间信息,其位置的识别是与数据联系在一起的,这是地理信息区别于其他类型信息的最显著的标志。地理信息的这种定位特征,是通过经纬网或公路网建立的地理坐标来实现空间位置的识别;地理信息还具有多维结构的特征,即在二维空间的基础上实现多专题的第三维结构,而各个专题型实体型之间的联系是通过属性码进行的,这就为地理系统各圈层之间的综合研究提供了可能,也为地理系统多层次的分析和信息的传输与筛选提供了方便。地理信息的时序特征十分明显,因此可以按照时间尺度将地理信息划分为超短期的(如台风、地震)、短期的(如江河洪水、秋季低温)、中期的(如土地利用、作物估产)、长期的(如城市化、水土流失)、超长期的(如地壳变动、气候变化)等。地理信息的这种动态变化的特征,一方面要求地理信息的获取要及时,并定期更新;另一方面要从其自然的变化过程中研究其变化规律,从而作出地理事物的预测与预报,为科学决策提供依据。认识地理信息的这种区域性、多层次性和动态性变化的特征对建立地理信息系统,实现人口、资源、环境等的综合具有重要意义。
地理信息系统是以地理空间数据库为基础,在计算机软硬件的支持下,对空间相关数据进行采集、管理、操作、分析、模拟和显示,并采用地理模型分析方法,适时提供多种空间和动态的地理信息,为地理研究和地理决策服务而建立起来的计算机技术系统。因此,地理信息系统具有以下三个方面的特征:
(1)具有采集、管理、分析和输出多种地理空间信息的能力。
(2)以地理研究和地理决策为目的,以地理模型方法为手段,具有空间分析、多要素综合分析和动态预测的能力,并能产生高层次的地理信息。
(3)由计算机系统支持进行空间地理数据管理,并由计算机程序模拟常规的或专门的地理分析方法,作用于空间数据,产生有用信息,完成人类难以完成的任务;计算机系统的支持是GlS的重要特征,它能使GIS得到快速、精确、综合地对复杂的地理系统进行空间定位和动态分析。
二、GIS的组成部分
地理信息系统是一种计算机技术系统,它由信息输入、存储、数据的分析处理和信息的输出等基本部分组成,并在计算机软、硬件支持下运行工作。各种组成在GIS中所起的作用不同,可以分为五个组成部分:
(1)计算机硬件:指GIS所需要的基本设备。这些设备用来存储、处理和显示。对象主要是数字地图或数字图像数据。
(2)计算机软件:包括机器运行所需的各种程序及有关资料,如操作系统、编译程序、汇编程序、专用程序、GIS数据库管理系统、各种分析程序及使用分册、说明等。主要作用是完成各种GIS应有的操作。
(3)数据:GIS研究所需要的各种地理空间数据,包括数字化了的地图数据、经过数字转换的图像数据、分析用的统计数据等等。
(4)过程:GIS工作时,为了得到问题的解答而执行的一步一步的动作。不少系统在执行时,为了方便用户使用目录选择方式,又称作点“菜单”方式,作哪个动作就点哪项;也有的系统使用命令方式,根据用户需要打入命令,由系统完成,可以一个命令做一个动作,也可以一个命令完成一系列动作,也就是命令过程。
(5)专家:了解GIS,知道怎样使用系统,这是最重要的。有些系统不能被人完全了解,因而不能发挥出全部作用,更不能进一步发展系统。创造GIS的工作量很大,常以“人年”作为计量工作的单位。
三、GIS的类型
(1)专题地理信息系统:是具有有限目标和专业特点的地理信息系统。为特定的专门的目的服务,如水资源管理信息系统、矿产资源信息系统、农作物估产信息系统、草场资源管理信息系统、水土流失信息系统、环境管理信息系统等。
(2)区域地理信息系统:主要以区域综合研究和全面信息服务为目标。可以有不同规模,如国家级的、地区或省级的、市级或县级等为各不同级别行政区服务的区域信息系统,也可以按自然分区或流域为单位建立区域信息系统。区域信息系统如加拿大国家信息系统、美国橡树岭地区信息系统、圣地亚哥县信息系统、中国黄河流域信息系统等。
(3)地理信息系统工具:它是一组具有图形图像数字化、存储管理、查询检索、分析运算和多种输出等地理信息系统基本功能的软件包。它们或者是专门研究的,或者是在完成实用地理信息系统后抽去具体的区域或专题的地理空间数据后得到的。这些软件适于用来作为地理信息系统支撑软件,以建立专题或区域性的实用性地理信息系统,也可以作教学软件。由于地理信息系统设计技术较高,而且重复编辑比较复杂的基础软件也造成人力的极大浪费,因此采用地理信息系统工具,无疑是建立实用地理信息系统的一条捷径。
四、资源与环境研究中的GIS
进入21世纪,中国的GIS事业发展迅速,GIS的作用日益被大众所认识,并蓬勃应用到各种领域中。人类正在进入以信息技术和空间技术应用为特征的新型信息时代。作为新兴技术科学的地理信息系统,从20世纪80年代末期以来已成为最活跃的信息产业之一。它涉及到GIS软件、硬件、数据、遥感与航空摄影、制图、野外数据采集、数据交换、系统集成和咨询等内容。其中,软件是GIS的技术核心,而从事软件开发和系统集成的公司或机构则往往成为GIS产业的主体。
早期GIS主要应用于自动制图、设施管理和土地信息系统(LIS),后来逐步扩展到资源与环境管理、森林清查、城市规划、市政管理、灾害监测与预测、科学研究和军事战略等众多领域。随着GIS技术的成熟,数据积累和应用环境的改善,它的应用范围不断扩展,应用程度不断深化。GIS在资源与环境研究中的应用主要表现在以下几个方面:
1.资源清查与管理
资源的清查、管理和分析是GIS应用中趋于成熟而重要的领域,包括土地资源、森林资源和矿产资源的清查、管理,土地利用规划,野生动植物的保护等。资源清查是地理信息系统最基本的职能,这时系统的主要任务是将各种来源的数据汇集在一起,并通过系统的统计和覆盖分析功能,按多种边界和属性条件,提供区域多种条件组合形式的资源统计和资源状况分析,为资源的合理开发、利用和科学管理提供依据。
以土地利用类型为例,可以输出不同土地类型的分布和面积,按不同高程带划分的土地利用类型、不同坡度区内的土地利用现状、不同岩性引起的土地利用差异以及不同时期的土地利用变化等,为资源的合理利用、开发和科学管理提供依据。又如中国西南地区国土资源信息系统,设置了三个功能子系统,即数据库系统、辅助决策系统、图形系统。资源数据存储了1500多项300多万个。该系统提供了一系列资源分析与评价模型、资源预测预报及西南地区资源合理开发配置的资料。可绘制草场资源分布图、矿产资源分布图、各地县产值统计图、农作物产量统计图、交通规划图、重大项目规划图等不同内容的专业图件。
2.区域与城镇规划
城市与区域规划中要处理许多不同性质和不同特点的问题,它涉及资源、环境、人口、交通、经济、教育、文化和金融等多个地理变量和大量数据。地理信息系统的数据库管理有利于将这些数据信息归并到统一系统中,最后进行城市与区域多目标的开发和规划,包括城镇总体规划、城市建设用地适宜性评价、环境质量评价、道路交通规划、公共设施配置以及城市环境动态监测等。这些规划功能的实现,是以地理信息系统的空间搜索方法、多元信息的叠加处理、空间分析方法和网络分析功能等作为保证的。中国大、中型城市很多,根据加快中心城市的规划建设,加强城市建设决策科学化、现代化的要求,利用地理信息系统作为城市规划、管理和分析的工具,具有十分重要的意义。
3.环境灾害监测
利用GIS方法和多时相遥感数据,可以有效地用于森林火灾的预测预报、洪水灾情监测和灾情损失的估算,为救灾抢险和防洪决策提供及时准确的信息,例如据中国大兴安岭地区的研究,通过普查分析森林火灾实况,统计分析十几万个气象数据,从中筛选出气温、风速、降水、温度等气象要素、春秋两季植被生长情况和积雪覆盖程度等14个因子,用模糊数学方法建立数学模型,建立微机信息系统的多因子的综合指标森林火险预报方法,对预报火险等级的准确率可达73%以上。又如黄河三角洲地区防洪减灾信息系统,在ARC/INFO地理信息系统软件支持下,借助于大比例尺数字高程模型,加上各种专题地图,如土地利用、水系、居民点、油井、工厂排放工程设施及社会经济统计信息等,通过各种图形叠加、操作、分析等功能,可以计算出若干个泄洪区域及其面积,比较不同泄洪区域内的土地利用、房屋、财产损失等,最后得出最佳的泄洪区域,并制定整个泄洪区域内的人员撤退、财产转移和救灾物资供应等的最佳运输线路。
4.环境保护及管理
GIS技术也是进行环境评价、环境规划管理的有力工具。其内容包括:环境监测和数据收集,建立基础数据库和环境动态数据库,建立环境污染的有关模型,提供环境管理的统计数据和报表输出,环境作用分析和环境质量评价,环境信息传输和制图等。
环境管理涉及人类社会活动和经济活动的一切领域,一个大中型城市每年收集和监测的环境数据可能多达100万个,对如此大量的数据,应使其有效地为环境管理决策及其他用途服务。一个地方环境管理信息系统的功能有:为环境管理部门提供数据和信息系统存储方法——基础数据库系统;提供环境管理的数据统计、报表和图形编辑方法;建立环境污染的若干模型,为环境管理决策提供支持;提供环保部门办公软件;提供信息传输的方法和手段。
例如,上海市环境管理雅息系统具有如下主要特征:①建立了动态数据库,可存储环境监测数据(如包括污染源和环境质量)和其他有关数据(如环境标准、水文、气象等),对大多数环境管理功能来说,实现了数据共享;②面向环境质量管理,可以对环境质量状况的统计、评价、预测、规划以及其他管理提供支持;③为实现面向污染源的污染控制管理提供支持,可以实现排污收费、排污许可证制度的管理;④为便于用户使用,系统设计一个界面友好的窗口菜单系统,使用方便,可以提供不同形式的输出,包括屏幕显示、表格打印、图形绘制、磁盘输出等,还预留了远程通讯接口。
5.宏观决策
GIS利用有效的数据库,通过一系列决策模型的构建和比较分析,可为国家或区域的宏观决策提供科学依据。例如GIS支持下的土地承载力的研究,可以解决土地资源与人口容量的规划。中国在三峡地区研究中,通过利用地理信息系统和机助制图的方法等多种功能建立了环境监测系统,为三峡宏观决策提供了建库前后环境变化的数量、速度和演变趋势等可靠依据。又如,通过水土流失监测系统数据库中的水土流失强度、地质岩性、坡度及其他资源与环境的相关数据进行分析研究,利用图形叠置等功能和变化的规律模型,可以进行水土流失的预测,为水土保持方案的编制及实施生态环境治理等提供坚实的数据基础,为宏观决策提供依据。
地理信息系统(GIS,Geographic Information System)是以采集、存储、管理、分析、描述和应用整个或部分地球表面(包括大气层在内)与空间和地理分布有关的数据的计算机系统(97年的参考文献)。它由硬件、软件、数据和用户有机结合而构成。它的主要功能是实现地理空间数据的采集、编辑、管理、分析、统计、制图的工具已逐步发展起来。
GIS始于60年代的加拿大与美国,尔后各国相继投入了大量的研究工作,自80年代末以来,特别是随着计算机技术的飞速发展,地理信息的处理、分析手段日趋先进,GIS技术日臻成熟,已广泛地应用于环境、资源、石油、电力、土地、交通、公安、急救、航空、市政管理、城市规划、经济咨询、灾害损失预测、投资评价、政府管理和军事等与地理坐标相关的几乎所有领域。
但是,随着信息技术,尤其是计算机技术的快速发展、数字地球(Digital Earth)的提出与实施,以及GIS的应用深度的不断深入和广度的扩大,GIS正处于急剧变化与发展之中,并对GIS提出了许多新的要求。一方面,计算机的进步、信息网的发展和利用等技术上的突破,使得以数字形式表示信息更加容易,另一方面,地理信息仍滞后于其它更适合于以数字形式表示的信息,例如数字和文本。因此,地理信息的使用,又存在一定的困难和障碍,如果这些障碍能够妥善解决,GIS的应用将会取得突飞猛进的发展。本文就目前地理信息系统的热点问题进行介绍、分析和总结。
2 计算机技术对GIS发展趋势的影响
GIS技术依托的主要工具和平台是计算机及其相关设备。进入90年代以来,随着计算机技术的发展, 计算机其微处理器的处理速度愈来愈快性能价格比更高; 其存储器能实现将大型文件映射至内存的能力,并且能存储海量数据。此外, 随着多媒体技术、空间技术、虚拟实景、数字测绘技术、数据仓库技术、计算机图形技术三维图形芯片、大容量光盘技术及宽频光纤通讯技术的突破性进展,特别是消除数据通讯瓶颈的卫星互联网的建立,以及能够提供接近实时对地观测图象的高分辨、高光谱、短周期遥感卫星的大量发射,这些为GIS技术的广泛、深入应用展示了更加光明的前景。同时, 也使当前的GIS已不能满足信息时代、数字时代的要求,目前GIS主要总体上呈现网络化[1][3]、开放性[5]、虚拟现实[1]、集成化[2]、空间多维性[4][6]等发展趋势。
2.1 网络化——网络GIS
计算机网络技术的最新发展推动着当代GIS技术的快速更新和发展,使得在因特网上实现GIS应用日益引起人们的关注,建立万维网GIS(WWWW GIS或Web GIS)是近年来GIS研究领域的一个热门话题。Web GIS或互联网地理信息系统(Internet GIS)是当前GIS的一个重要发展方向。
目前,WWWGIS的建设面临四个方面的挑战:网上数据发布、网上数据互操作、网上数据采掘和网上数据管理及安全性。与传统的GIS相比,Web GIS具有以下特点:
(1)适应性强 Web GIS是基于互联网的,因而是全球的,能够在不同的平台运行。
(2)应用面广 网络功能将使Web GIS应用到整个社会,真正实现GIS的无所不能,无处不在。
(3)现实性强 地理信息的实时更新在网上进行,人们能得到最新信息和最新动态。
(4)维护社会化 数据的采集、输入、空间信息的分析与发布将是在社会协调下运作,对其维护将是社会化,减少重复的劳动。
(5)使用简单 用户可以直接从网上获取所需要的各种地理信息,直接进行各种地理信息的分析,而不用关心空间数据库的维护和管理。
网络GIS可实现网上发布、浏览、下载,实现基于Web的GIS查询和分析。尽管目前已有多家国内外公司推出Web GIS,总地来说,Web GIS尚处在试验研究阶段,其最终目标是应能实现GIS与WWW技术的有机结合,GIS通过WWW成为大众使用的技术和工具。
2.2 开放性——开放式GIS
开放式地理信息系统(Open GIS)是指在计算机和通信环境下,根据行业标准和接口(Interface)所建立起来的地理信息系统。它不仅使数据能在应用系统内流动,还能在系统间流动。Open GIS是为了使不同的地理信息系统软件之间具有良好的互操作性,以及在异构分布数据库中实现信息共享的途径。为此,Open GIS要具有下列特点:
(1)互操作性:不同地理信息系统软件之间连接、信息交换没有障碍。
(2)可扩展性:硬件方面,可在不同软件、不同档次的计算机上运行,其性能和硬件平台的性能成正比;软件方面增加新的地学空间数据和地学数据处理功能。
(3)技术公开性:开放的思想主要是对用户公开,公开源代码及规范说明是重要的途径之一。
(4)可移植性:独立于软件、硬件及网络环境,不需修改便可在不同的计算机上运行。
除此之外,还有诸如兼容性、可实现性、协同性等特点。
为了研究和开发Open GIS技术,1996年在美国成立的开放地理信息联合会主要研究和建立了开放式地理数据交互操作规程(OGIS,Open Geodata Interoperable Specification)。OGIS是为了寻找一种方式,将地理信息系统技术、分布处理技术、面向对象方法、数据库设计及实时信息获取方法更有效地结合起来。基于OGIS规范制订的开放系统模型是一种软件工程和系统设计方法,这种方法应用于GIS领域,侧重于改变当前GIS模型中特定的应用系统及其功能与它内部数据模型及数据格式紧密捆绑的现状。当然,OGIS只是对Open GIS定义了抽象的互操作规程,具体如何实现,还需采用分布式对象的技术,通过Acrobat、OLE、ActiveX、Java等语言实现。
Open GIS技术将使GIS始终处于一种组织、开放式的状态,真正成为服务于整个社会的产业以及实现地理信息的全球范围内的共享与互操作,是未来网络环境下GIS技术发展的必然趋势。
2.3虚拟现实——虚拟GIS
虚拟GIS就是GIS与虚拟现实技术(Virtual Reality)的结合。VR技术是当代信息技术高速发展,并与其他技术集成的产物,是一种最有效地模拟人在自然环境中视、听、动等行为的高级人机交互技术。这种模拟具有三个最基本的特征,即Immersion(沉浸)-Interaction(交互)-Imagina-tion(构想)。
由于技术的限制,目前还未能开发出适用于遥感和GIS用户需要的真3维可视化的数据分析软件包。GIS与虚拟环境技术相结合,将虚拟环境带入GIS将使GIS更加完美。GIS用户在计算机上就能处理真3维的客观世界的虚拟环境中将能更有效地管理,分析空间实体数据。目前虚拟GIS(VGIS)的研究主要集中在虚拟城市。
2.4 多媒体GIS
多媒体技术(Multia-Media)是一种集声、像、图、文、通讯等为一体,并以最直观的方式表达和感知信息,以形象化的、可触摸(触屏)的甚至声控对话的人机界面操纵信息处理的技术。应用多媒体技术对GIS的系统结构、系统功能及应用模式的设计产生极大的影响,使得GIS的表现形式更丰富,更灵活,更友好。
多媒体地理信息系统(MGIS)将文字、图形(图像)、声音、色彩、动画等技术融为一体,为GIS应用开拓了新的领域和广阔的前景。它不仅能为社会经济、文化教育、旅游、商业、决策管理和规划等提供生动、直观、高效的信息服务,而且将使电脑技术真正走进人类社会生活。多媒体技术在GIS领域的深入应用,乃至出现具有良好集成能力的MGIS是技术发展的必然。
2.5 集成化——3S技术的结合
3S技术指的是全球定位系统(GPS)、遥感技术(RS)、地理信息系统(GIS)。3S技术的结合与集成充分体现了学科发展从细分走向综合的规律。
GIS发展的重要趋势是与全球定位系统(GPS)和遥感(RS)的集成,从而构成实时的,动态的GIS。GPS为GIS的快速定位和更新提供手段,遥感技术的多谱段、多时相、多传感器和多分辨率的特点,为GIS不断注入“燃料”,反过来又可利用GIS支持从遥感影像数据中自动提取语义和非语义信息。
3S技术整体结合所构成的系统是高度自动化、实时化的GIS系统。这种系统不仅具有自动、实时地采集、处理和更新数据的功能,而且能够分析和运用数据,为各种应用提供科学的决策咨询,并回答用户可能提出的各种复杂问题。
2.6 空间多维性——三维GIS与时态GIS
在许多地学研究中,人们所要研究的对象是充满整个3D空间的,如大气污染、洋流、地质模型等,必须用一个(X,Y,Z)的3D坐标来描述。在3D GIS中,研究对象是通过空间X、Y、Z轴进行定义,描述的是真3D的对象。随着计算机技术和GIS在许多行业诸如地质、矿山、海洋、城市地下管网,城市空间规划、城市景观分析、无线通信覆盖范围分析等对三维GIS的需求日益迫切,3D GIS的理论和应用近年来受到许多学者的关注。到目前为止,虽然有3D GIS系统问世,但其功能远远不能满足人们分析问题的需要,原因主要是3D GIS理论不成熟,其拓扑关系模型一直没有解决;另外三维基础上的数据量十分大,很难建立一个有效的,易于编程实现的三维模型,计算机海量数据的处理为三维GIS提供了基础。
2.6.2 时态GIS
人们都在一定的空间和时间环境中生存并从事各种社会活动。从信息系统,尤其是GIS的实用角度出发,时间可以看成是一条没有端点,向过去和将来无限延伸的线轴,它是现实世界的第四维。时间和空间不可分割地联系在一起,跟踪和分析空间信息随时间的变化,应当是GIS的一个合理目标。这样的GIS就被称为时态GIS(Temporal GIS)。
记录历史数据有时候是非常重要的。在GIS中也要经常查询历史,最明显的例子就是宗地,一块宗地可能经过许多次的买卖或变化。在土地纠纷中,人们需要详细的历史记录作为法律依据。GIS在环境应用中,也经常需要用到多时态的信息对环境进行综合评价。所以,研究GIS的时态问题则成为当今GIS领域的一个重要方向。
时态GIS的组织核心是时空数据库,其概念基础则是时空数据模型。时空数据结构的选择应以不同类型的时空过程和应用目的作为出发点。虽然人们已分别在时态数据库和空间数据库研究方面取得很大进展,但是“时态”+“空间”≠ “时空”,两者难以简单地组合起来,这导致了时态GIS研究与应用的困难。作为一种系统方法,时态GIS的研究和应用还有很长的路要走。
2.7 部件组装化——组件式GIS
GIS软件是一种大型的软件,开发一个功能完备的GIS软件是一项极其复杂的工程。如何合理地组织GIS软件的结构,一直是GIS软件技术专家们研究的问题。它的发展体经历了如下历程:GIS模块、集成式GIS、模块化GIS和核心式GIS。当前计算机软件控件技术(ActiveX控件,其前身OLE控件)为GIS软件提供了一种新的开发模式。
组件化GIS基于标准的组件式GIS平台,各组件之间不仅可能自由、灵活地重组,而且具有可视化的界面和方便的标准的接口。其特征主要体现在:
(1)高效无缝的系统集成 允许将专业模型、GIS控件、其它控件紧密地结合在统一的界面下。
(2)无须专门的GIS开发语言 只要掌握基于Windows平面的通用环境(VB,VC++,Delphi,power Builder等),以及组件式GIS各控件的属性、方法和事件,就能完成应用系统的开发。
(3)大众化的GIS 用户可以象使用其它ActiveX控件一样使用GIS的控件,使非专业的GIS用户也能胜任GIS应用开发工作。
(4)开发成本低 非GIS功能可以利用非专业控件,降低了系统的成本。