设为首页 加入收藏
| 网上投稿 | 邮箱登录 | 网上留言|
返回首页
 你现在的位置:首页>>专题专栏>>珠江水利论坛>>论文荟萃
建设珠江水利数据中心 构造绿色珠江的信息资源基础

珠江水利委员会信息中心   陈伟豪,孙祥鹏

 

摘要:分析了珠江委水利信息化建设的现状,由建设绿色珠江的需要出发,提出建设珠江水利数据中心,并提出相应的建设内容和建设方案。

关键词: 绿色珠江,数据中心,水利信息化

 

1   引言  


利数

据存

用系

利信

统用

刚过去的6月,珠江遭受超百年一遇的特大洪灾,广东、广西损失惨重,因灾直接经济损失约110多亿元,死亡110多人。

为什么在红水河、郁江、东江、北江都修建了许多大型、特大型的水库、水电站的情况下,却依然发生了如此严重的灾难?这不能不引起我们认真反思,通过回顾防洪历程,我们可以发现问题所在:这次珠江流域的防汛,更多的是严防死守、被动抢险,而缺少对流域骨干水库的统一调度和临时滞洪区的主动启动。

联系去冬今春珠三角咸潮的大规模爆发及饮水资源严重短缺,我们每个人都应当认识到,珠江的健康生命和珠江流域人民的饮水安全正面临严峻的考验。

建设绿色珠江,重点是做好流域的规划治理和流域的水资源统一调度工作,这需要有翔实、全面的基础数据资料为依据。而当前珠江流域水利数据普遍存在的残缺不全、共享困难、智能化程度不高等问题,已成为珠江水利信息化、现代化的瓶颈。因此,建设珠江水利数据中心是顺利开展水利现代化、建设绿色珠江的前提和基础。

2  珠江水利信息化现状

水利信息化的过程就是对水利信息进行数据采集、信息传输、信息存储、应用处理的过程。

2.1 信息采集

珠江委尚未建立完善的数据采集系统,主要表现在:从空间上,信息采集点严重不足,收集信息的范围十分有限,原始数据采集不全面;从时间上,大量宝贵信息分散分布,未能得到妥善保存,数据丢失严重。

信息采集多以人工的、临时性的为主,缺乏固定的、自动化的采集设施,这不仅难以形成稳定的信息采集系统,同时也带来了人员管理、资金重复投入等方面的问题。

2.2 数据库建设

目前,珠江委已建或在建的数据库以及数据库资源有:水文数据库(水文局)、基础工情库(防汛办)、珠江重点堤防普查数据库(珠江设计公司)、珠江遥感信息数据库(科研所)、广东省三防指挥系统工程综合数据库资料收集和录入(信息中心)、珠江委电子地图(信息中心)、档案数据库(档案馆,在建)。但这些数据库存在一系列问题,包括标准化差、数据不全、共享性差、支持平台基础薄弱等。各业务数据和办公数据分散在各个业务系统和业务部门之中,没有统一的规范。而水利技术基本信息数据库、水利行政管理基本信息数据库、水利政策法规信息数据库等尚未建设。

2.3   数据库管理

在数据管理方面,由于目前已建的数据库存储比较零散,各单位的业务数据分别由各单位自行管理、自行选择存储的数据库类型和数据格式,很难形成统一的访问机制,形成逻辑上的数据隔阂,当需要进行数据备份和日志记录时,要分别针对不同的数据类型进行处理,无法进行统一管理,造成了很大的人力、物力的浪费。同时,有些单位对数据灾难估计不足,尚未建立完善的数据备份、恢复机制,很多数据尚是孤本,一旦数据库受到病毒攻击或者产生硬件故障,所遭受的数据损失将无法估计。

2.4   信息资源开发与利用

目前,珠江委水情中心、西江局水情分中心尚未建立,水情、气象等信息的接收、处理由珠江委水文局水情处负责。水情、气象、预报等信息共用同一数据库,随着信息数据量的不断增大,用户的不断增多,数据库已出现不堪重负的迹象,数据库响应慢,甚至产生数据库连接超时等现象。

面向数据库的应用系统,诸如数据挖掘和数据优化处理系统等皆未建设。数据资源的匮乏与应用系统的不足形成了一系列的恶性循环。

3  建设必要性

3.1  建设绿色珠江的要求

近期,珠江委党组根据科学发展观要求、按照部党组治水新思路,提出了“维护河流健康生命,建设绿色珠江”的流域水利发展战略目标。

实现这一目标,需要及时掌握河流健康状况,及时掌握流域的水信息,提高流域水信息的准确性、实时性和共享程度;需要通过数据中心的建设,将流域全局性的水信息、工情的基础数据进行统一整合、集中建设;需要利用数据挖掘技术找出海量数据间的直接联系和潜在的间接联系,给决策者和各类应用系统提供及时、全面、准确的信息服务和应用服务,达到全面了解河流的情况,从而为“维护河流健康生命,建设绿色珠江”目标的实现提供支持和保障。

3.2行使机构职能、进行综合决策的迫切需要

解决流域内洪涝灾害、水资源短缺、水环境污染和水土流失等四大水问题是一项长期而艰巨的任务,需要长期性的综合决策支持。综合决策是一个非常复杂的过程,必须要分析大量已知数据信息,从中抽取、集成有用数据,得出未来的发展趋势,这是一个海量的工作。如果单靠人工完成,那将是难以承受的艰巨任务,并且可能因为工作量过大,工期过长,无法适应水情的变化,白白浪费人力、物力。

建立以数据仓库和数据挖掘技术为基础、以联机分析处理技术为实现手段的决策支持系统是实现快速、高效、准确地收集信息、分析信息和提高决策水平的一种有效、可行的体系化解决方案。

数据挖掘技术是数据库技术的新发展。数据挖掘能从数据库和数据仓库中自动分析数据, 进行归纳性推理, 从中发掘出潜在的模式,或产生联想, 建立新的业务模型, 帮助决策者调整策略,做出正确的决策。一些数据挖掘工具还能够解决一些很消耗人工时间的传统问题,因为它们能够快速地浏览整个数据库,找出一些专家们不易察觉的极有用的信息。

数据挖掘与传统的数据分析(如查询、报表、联机应用分析)的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识.数据挖掘所得到的信息应具有先未知、有效和可实用三个特征。
    数据仓库和数据挖掘是数据中心的两大核心技术。通过数据仓库的建设,将全局性的基础数据进行统一整合、集中建设,利用数据挖掘技术找出海量数据间的直接联系和潜在的间接联系,达到快速获取所需数据、提供信息服务和应用服务,从而为重大的综合性决策提供有力支持。

3.3进行资源有效整合的需要

通过数据中心的建设使大量分散的、标准不统一的水利数据源按统一的规范整合成为有效的水利信息资源,可充分发挥其使用价值;基于数据中心的标准框架体系和规范指导各专业数据库的建设并进行集中管理、统一服务,可避免数据源建设的重复投资。

通过建立一个灵活、动态的数据整合机制,能够实现有限范围内数据库资源的连接、抽取、整合,能辅助数据管理平台人员根据不同的应用需要完成目标数据的连接、抽取、整合、储存。

3.4实现数据资源高可用性的需要

随着珠江水利信息化的建设进程,水利政务的24小时不间断服务也就显得愈发重要,数据库资源的高可用性是其中的关键一环。目前,实现高可用性的主要技术手段是分布式群集技术,由一台主服务器提供正常服务,一台或多台从服务器作为监视服务器,监视主服务器的运行状态,一旦发现异常,能够在微秒或秒级时间内实现服务的主从转换,让用户感觉不到服务故障。

根据目前数据分散管理的现状,如果为每个处室的数据库都建立高可用系统,无疑将是巨大的资源浪费;如果不建立高可用系统,将无法保证系统的不间断服务,这显然无法适应今后水利信息化建设的需要。唯有在数据中心的框架下建设高可用和高性能系统才是正确的解决途径。

3.5  积极发挥水利的社会服务功能、实现资源共享的需要

信息资源已经成为与物质资源同等重要的资源。随着各级水行政主管部门机构改革和职能转变,客观上要求各级水行政主管部门广泛获取、充分利用信息资源以便更好地管理错综复杂的水政事务,提高各级水行政主管部门的管理水平和工作效率,加强工作人员与广大公众之间的联系,使社会各界有效监督政府的工作和发挥水利的社会服务功能。

建立数据中心,解决数据资源不足、服务单一、共享困难的问题,不仅能实现流域内信息的共享服务,而且通过提供统一的数据接口能够与水利部、其它水利部门进行数据交换和资源共享,构成完整的珠江水利资源系统,向珠江各级政府和民众提供全面、翔实的水利信息。

再有,水利数据与海洋、地质、气象等其他领域的数据一起构成了国家科学数据共享体系,服务于经济发展、科技进步和国家安全。水利信息的共享不仅是水利行业内部的需要,也是国家其他行业的需要。

4  建设内容

数据中心的建设是个系统的工程,主要包括以下几部分的内容:

4.1  基础信息资料收集

资料收集范围涵盖珠江片的云南、贵州、广西、广东、海南、湖南、江西和福建等八省(区)。收集的主要内容包括:基础地理信息、社会经济信息、水利专业信息等。

4.2  技术标准、规范

标准化和规范化是数据中心重要的基础性工作,是实现规划目标,保证水利信息交换、共享和应用支持的重要前提。

必须建立一套比较完整的数据中心的标准和规范体系。在贯彻执行国家标准和行业标准的基础上,并根据水利信息化的实际需要建立数据中心的标准体系。

4.3  高标准的运行环境

运行环境包括硬环境建设和软环境建设两部分。首先,要建设相对独立的数据中心机房,以保证实体(各种设备)的正常运行和安全。遵照国家的有关规定,建设防电磁泄漏系统以及通风系统、防火系统、防水系统、供电系统、监控系统、门禁系统和布线系统等。

其次,要建设高标准的信息安全系统。包括操作系统安全、防病毒和系统备份与应急、通信和网络安全、数据安全等。建立系统自动完善体制,能够实现系统的实时在线升级,弥补系统漏洞,扩充系统功能。

4.4  建设以SAN架构为基础的数据存贮、交换和服务系统

存贮区域网络(SAN)架构(如图4.5.1)是当代大型数据中心普遍采用的先进技术,它利用光纤和光交换机、光纤集线器等数据交换设备,具有很高的可用性和可靠性。这是和数据库一起同为数据中心的核心建设内容。

存储数据交换设备

网络

数据

交换

磁盘设备

光盘库

磁带库

2  SAN架构图

 

4.5  数据库集成与建设

珠江水利数据中心规划建设水利政策法规数据库、水利工程基本信息库、水利空间数据库、水文基本数据库、水资源基本数据库、水利技术标准基本数据库、水利行政管理基本数据库和档案数据库等八个基础性、全局性数据库。

在推进应用系统的建设中,建立相关的专业数据库。为了避免重复建设、显著减少运行管理的成本,大部分专业数据库连同其应用系统可托管在数据中心内。

4.6  应用服务平台

应用服务平台由数据共享与访问控制、空间分析、遥感信息处理和专业应用等服务中间件构成。

应用服务平台各部分之间通过标准的互操作协议,相互关联,协同工作,共同支撑业务应用的实现。因此,业务应用可以根据业务处理的需要,在标准服务协议的支持下,请求各种中间件服务,从而完成业务处理的功能。

4.7  应用系统

       包括门户网站、电子政务系统、数据检索与发布系统、防汛决策指挥系统等专业系统以及财务软件等非专业系统。它们构成了信息资源开发利用的功能实现。

5  小结

综上所述,建设珠江水利数据中心已是实现珠江流域水利现代化、建设绿色珠江的关键一环。通过建设数据中心,构造珠江的信息资源基础,让珠江的每一声欢笑、叹息,每一次伤痛、愈合,都能及时、准确地上传下达,为决策者和管理者建设绿色珠江、生态珠江提供全面的数据资源和技术支撑。

 

2005-07-13
 
[∷打 印∷][∷关 闭∷]

主办单位:水利部珠江水利委员会 承办单位:水利部珠江水利委员会信息中心
粤ICP备11053349 Copyright©2007 珠江委网站版权所有  
建议使用 IE6.0以上版本进行浏览,最佳显示1024x768