汉语大全>行政管理论文>数据挖掘技术在电子政务系统中的应用

数据挖掘技术在电子政务系统中的应用

详细内容

1引言信息技术的迅速发展和成熟,使得电子政务应用不断深化。电子政务能够辅助政府更好地为公众服务,也能满足人们对政府和职能部门高效运转的要求。从全国范围看,经过多年的实践,电子政务建设和应用初见成效。各级政府在不同的层面建设和实现了不同的功能。这其中建立和获取了很多数据。这些数据中具有一些知识。但目前的系统只是实现数据的输入、查询、统计等功能,还没有能够从中挖掘这些知识。充分利用这些数据,挖掘其中的知识,将能够为政府的决策提供更好的支持,能够更好地满足快速有效服务大众的要求。

2电子政务数据的特点电子政务涉及面广,因此拥有的数据也是海量而复杂的。归纳起来看,电子政务数据有下面这些特点:2.1数据种类多。政府事务和管理涉及很多方面。因此数据类型也丰富。这些数据有统计数字、文本、图像、视频、音频等。数据种类多也使得数据的格式多样。

2.2海量数据。电子政务面向的用户广,业务繁多。随着系统的运行,每天由文本、图像、音频、视频等组成的数据,以及网络服务器访问记录、浏览器日志记录、用户个人信息、用户对话等生成的数据量巨大。数据的动态性。在电子政务系统运行过程中,各种数据库中的数据都在不断扩充和增加。

3数据挖掘方法应用数据挖掘时涉及两个方面的问题。第一是算法层面。第二是实现层面。在算法层面,数据挖掘主要来源于机器学习、模式识别等人工智能算法。这包括关联规则、分类、聚类等算法。关联规则挖掘:其目的就是为了挖掘出隐藏在数据间的相互关系。分类:分类算法的输入集是一组样本集合和几种类别标记。首先为每一个样本赋予一个标记,然后训练一个分类器。最后对新样本进行分类。聚类分析:聚类分析法的输入是一组未标记类别的样本,也就是说此时输入的样本还没有进行任何分类。

其目的是根据一定的规则,合理地划分样本。而所依据的这些规则是由聚类分析算法定义的,例如,可以是一个准则函数,可以是一条经验规则等。另外,数据挖掘还有一个重要的任务就是将结果呈现给用户,这需要一些机器学习的技术和其他计算机技术。在实现层面,不仅仅要考虑数据,还要考虑数据的存放。由于很多的数据是存放在数据库中,因此,不可避免需要采用数据库技术从而使数据挖掘算法能够更好地实现和更高效的运行。电子政务系统是一个大的系统,涉及的数据多而且丰富,用户众多,访问频繁。因此,电子政务系统通常会采用数据库。所以,在设计和实现挖掘算法的时候,需要充分采用数据库技术,从而使数据挖掘能更好地运行。

4电子政务系统中的数据挖掘功能形象地说,数据挖掘就是从大量数据中挖掘知识的过程。根据电子政务系统的特点,我们这里给出几种可能从中挖掘到的知识的类型。4.1用户关注热点的发现在电子政务网站上,有大量的政策、法规、通告、新闻等文件。用户会根据自己的喜好点击、浏览和下载这些文件。通过网络日志可以记录这些数据。这些数据可以给我们提供一些信息。通过对这些数据的分析,我们可以知道,在一段时间内,大多数用户对哪些,或者哪类的文件有兴趣。