美章网 资料文库 远程教育中Web挖掘技术的研究范文

远程教育中Web挖掘技术的研究范文

时间:2022-05-27 11:10:23

远程教育中Web挖掘技术的研究

一、数据挖掘常用技术方法

(1)粗糙集方法

其主要思想在于通过信息系统来表示知识,通过信息系统进行知识简约,导出问题决策和分类规则,归纳后可以从知识库中抽取更有价值的隐含知识和潜在规律。所以,粗糙集方法其实质就是在大量信息系统中进行信息系统属性约简,得到一种属性约简集的过程,最终得到抽取的规则和方法。

(2)遗传算法

它的基本思想是模拟生物生存进化过程中最优解的算法,其借鉴的生物学基础就是遗传和进化。通过遗传算法我们可以在数据库中进行搜索,并对其中随机产生的规则进行优化。遗传算法优点有以下两点:①在适应值函数有噪声下,遗传算法可以以极大的概率找到整体最优解而不容易陷入局部最优;②大规模并行计算机很适用于遗传算法。

(3)决策树算法

其主要方法是先对数据进行处理,然后用归纳算法产生可读的规则和决策树,最后对新数据进行决策分析。决策树算法有以下几个特点:①决策树算法描述结构较简单,容易为人所理解;②效率高,适用于大规模数据的处理;③拥有较高的分辨进度。

二、Web数据挖掘技术在远程教育中的应用

(1)远程教育介绍

远程教育作为一种重要的教育方法,被广泛的用在高等教育,职业教育和成人教育中。在现代远程教育中,学习者是通过点击鼠标和浏览网页来完成他们的学习过程,因而他们的学习习惯可以完全被系统日志记录。我们只需要分析和挖掘系统日志,就可以很好的对学习者的学习习惯进行分析,同时也可以了解到远程教育系统是否能很好的服务于学习者。

(2)Web数据挖掘

Web数据挖掘是数据挖掘技术与计算机网络技术的融合,网站上有三种类型数据,分别是:内容数据,结构数据以及使用数据。Web数据挖掘一般包括数据获得,数据预处理,模式发现,模式分析四部分。

①数据获得:按照数据挖掘的目的获取不同学习者的数据。Web内容挖掘收集的信息来自于我们的网站资源。Web结构挖掘收集的数据来自于HTML内部痕迹和网页之间的超链接。Web使用数据从客户端收集,数据包括IP地址,URL等。

②数据预处理:数据预处理是Web数据挖掘的关键一步,因为原始数据会受到不同程度的干扰,Web数据挖掘可能变得低质量而价值不高,因而数据预处理显得尤为重要。数据预处理处理的好坏直接关系着模型发现和模型分析。常用数据清理进行处理。

③模式发现:在数据预处理之后,这些数据消除了扰乱,我们就可以对这些数据用常用的算法进行处理,如决策树算法。

④模式分析:通过模式发现后,会产生一些规则和模型。怎样让学习者充分运用这些规则和模型,面对如此大量的晦涩的概念,我们通过模型分析,可以将这些规则和模型通过图形界面程序传递给学习者,方便他们学习。

(3)决策树算法应用

决策树算法是一种广泛应用的分类算法,具有描述简单,容易理解的特点。我们要将学习者的学习成绩与哪些因素有关分析出来,如课前预习,课后作业复习等。同时生成相应的决策树,可以得到做笔记认真完成作业的学习者,他们的学习成绩好,可以评定成为优秀。没有完成则评定为不优秀,循环往复。决策树算法可以很详细的记录学习者的学习情况,及时给予评价,督促学习者不断努力学习。

三、结语

综上所述,互联网技术与教育结合是未来教育发展方向,数据挖掘技术应用于远程教育,使得教育平台更加智能化和个性化。虽然数据挖掘技术处于刚刚起步阶段,相信随着更多的数据挖掘方法出现,数据挖掘将有更广泛的应用空间。

作者:彭浩单位:成都理工大学信息科学与技术学院

被举报文档标题:远程教育中Web挖掘技术的研究

被举报文档地址:

https://www.meizhang.comhttps://www.meizhang.com/dyjy/ycjylw/645217.html
我确定以上信息无误

举报类型:

非法(文档涉及政治、宗教、色情或其他违反国家法律法规的内容)

侵权

其他

验证码:

点击换图

举报理由:
   (必填)