您好,欢迎来到五一七教育网。
搜索
您的当前位置:首页基于Web的数据挖掘在远程教育个性化学习中的应用

基于Web的数据挖掘在远程教育个性化学习中的应用

来源:五一七教育网
维普资讯 http://www.cqvip.com 设备与技术 {总第56期J教育传播与技术 基于Web的数据挖掘在远程教育个性化学习中的应用 张建宇,叶长青 (华东师范大学教育信息技术系,上海200062) 摘要:远程教育本质上是一种个性化的服务,它要为学习者提供量身定做的学习资源,而且对学习者使用资源的过程 (即学习过程)进行教导、指导、引导、辅导和督导,而基于Web的数据挖掘技术为远程教育个性化服务提 供了技术支持,本文讨论其在远程教育个性化学习授导方面可能的应用空间。 关键词:远程教育数据挖掘个性化授导 一、前言 信息中获取有用知识的过程。 自1998年教育部批准清华大学等四校开展现代 Web结构挖掘是从人为的链接结构中获取有用的 远程教育试点起,或从2000年“教育部现代远程教育 知识。由于文档之间的互联,www能够提供除文档 试点经验交流会”后正式启动重点大学的试点之后, 内容之外的有用信息,利用这些信息可以对页面进行 中国远程教育以毋庸置疑的姿态进入了第三个阶段, 排序,发现重要的内容页面,重新组织内容结构,使 即开放灵活的远程学习(丁兴富,1992)。“服务”的 内容逻辑结构更加合理。 办学理念悄然兴起,不断深入人心,构建“沃尔玛” Web使用挖掘是主要通过挖掘相应站点的日志文 式的教育超市成为远程教育机构的梦想。“沃尔玛”超 件获取学习者的访问内容、停留时间、访问频度等, 市为市民提供便利快捷个性化的服务启发了教育者们 发现其学习访问模式等有用信息的过程。 构筑具有品牌效应的远程教育连锁超市,为学生提供 (一)挖掘流程 优质的个性学习支持服务成为当前热烈讨论的话题, 基于Web的数据挖掘一般流程是数据采集、预处 “个性化授导”应运而生。那么应该怎样使理念付诸 理、模式发现、模式分析及其应用。 实践,怎样在实践层面上运用有效的技术支撑个性化 1.数据采集 服务?本文旨在讨论把基于Web的数据挖掘技术应 根据挖掘的目的是明确收集学习者什么样的数据。 用于远程教育的个性化授导,通过获取学习者在Web Web内容挖掘是从Web自身资源的内容中收集信息,利 上学习过程的行为数据,如访问频度、内容、访问时 用网页自动化分类技术可以用来做站点搜索引擎。Web 间长短及偏好等,经过模式处理,得出学习者学习过 结构挖掘则从页面内部结构(intra-page)以及页面之间 程的一般模式规律,以此为学习者提供良好的个『生化 的结构(inter-page)获取资料,包括HTML内部标记和网 服务,使学习者得到更好的发展。 页之间的链接关系,可以以树的形式纪录下来。Web使 用挖掘从服务器端或者远程代理或者客户端来收集用 二、基于Web的数据挖掘 户使用过程的数据,如IP、URL、ID、Time等。 基于Web的数据挖掘是将Web的使用与传统的 2.预处理 数据挖掘结合起来,来获取Web知识的过程。一般来 Web内容挖掘的预处理把网页中的文本、图片及 说,基于Web的数据挖掘按照挖掘的对象不同,可以 其他文件转换成数据挖掘算法可用的形式。 分为Web内容挖掘、Web结构挖掘及Web使用挖掘。 Web结构挖掘的预处理对Web的页面结构进行 Web内容挖掘是指对Web页面内容及后台交易 分析、变形,使之适用于数据挖掘系统。 数据库进行挖掘,从Web文档内容及其描述中的内容 56 维普资讯 http://www.cqvip.com 2008.1教育传播与技术(总第56期) Web使用挖掘的预处理过滤掉价值不大的信息 (如用户访问的传输协议,错误代码等),补充用户完 整路径,识别用户(Single IP address/Multi Server Sessons Multiple IP address/Single Server Session/ Multiple IP address/Single User Multiple Agent/Single User)和识别事务(可以根据用户跨越页面时问长短 来划分事务,也可以根据用户一系列的page view直 到退回首页划分为一个会话事务)。 3.模式发现 经过数据预处理之后,应用一种合理的挖掘算法 或综合应用不同的算法,如关联规则分析、聚类和分 类技术、统计分析以及时序模式技术等,来处理“消 噪”后的数据,最终发现用户的访问模式。关联规则 分析可以发现学习者对内容页面之问的访问关系,调 整页面之间的结构关系,预测学习者可能访问的内容, 使其快捷地访问到感兴趣的内容。聚类分析挖掘访问 相同页面的相似学习者,可以为其群体提供特定的内 容,还可以将内容相关的页面归为一个组,为学习者 搜索内容提供服务,预先为学习者设定几个类别,利 用分类技术将学习者投射到某一个类中,为某一特殊 类提供特殊的个性化资源和学习支持服务,还可以用 于远程协作的学习小组分配。统计分析技术是通过统 计学习者经常访问或者访问频繁的内容,发现用户的 兴趣倾向,也可以统计非法II)、无效URI和未授权访 问等。这些信息对于提高系统性能,密切注意学习者 动向起着辅助决策作用。序列模式可以寻找用户频繁 出现的序列,预测学习者的行为,把其需要的资源主 动提供给他(她),减少系统响应时间。 4.模式的分析和应用 通过模式挖掘之后,生成的规则数目庞大,表达 晦涩,得不到很好的利用,这就需要对模式进行分析 评价,通过模式分析和应用技术处理,选择学习者易 于理解和接受的方式并显现出来。经常用到的是可视 化技术、联机分析技术和智能查询机制等。利用数据 挖掘与学习内容绑定的技术,在学习者学习过程中以 可视化方式指导其学习和个性发展。 (二)Web的数据挖掘在远程教育个性化授导中的 应用 1.学习者特征模型构建 根据学习者不同的特征参数,对学生学习活动进 行跟踪,记录与学习相关的信息。记录学习者经常访 问的URL,跟踪统计学生访问次数,总停留时问,该 学生访问的课程数,对哪些课程停留时问较长等。还 可以统计网站某个时问段内访问的次数,访问次数最 多的URL地址,学习者作业的过程,参与讨论的情 设备与技术 况,交流用的工具等。通过数据挖掘的去噪和模式发 现模块,得到学习者的学习特征风格,建立和完善学 习者学习模型,建立学习者个性数据库,为不同的学 习者提供合适学习策略提供基础。 2.为学习者提供个性化的学习资源 在启动学习者个性数据库之后,可以为学习者个 别需要调整学习资源,将与用户无关及用户不感兴趣 的资源过滤掉,即远程教育的界面自适应性。统计分 析技术的应用可以根据用户经常访问的页面来预测学 习者进一步的行为,推出其感兴趣的资源,减少学习 者等待时问,如同Microsoft Ofifce系列的人性化推理 预测。 3.个性化学习指导 不同的个体其背景各不相同,如个人的学习能力、 兴趣与学习习惯、原有基础、努力程度都存在巨大的 差异。每一个用户都有很多属性,可以采取进入系统 平台之前让用户提交测试用户属性信息的一组表单, 得到最初的学习类型,但是有些属性是持续变化的, 如学习能力、知识基础、学习历史等,可以挖掘用户 的使用数据日志分析他的浏览趋势,即一组数据项之 后出现另一组数据项,从而形成一组按时问排序的会 话,以预测未来的访问模式。这将有助于针对特别用 户群安排特定的内容,可以解决远程教育中针对各种 层次学生进行因材施教的问题。 针对学习者个性特点建立个性化的学习策略库, 动态地获取学习者当前学习过程信息,将挖掘处理后 的信息反馈在学习界面上,给学习者及时恰当的学习 指导。 4.改进系统性能 对远程教育机构来说,学习者的满意度和服务质 量是关键,系统的安全性和稳定性能对决定学员是否 继续使用下去起着重要的作用。随着远程服务的发展, 网上交费等陆续出现,安全性被越来越多地关注。Web 的使用挖掘提供了网站构架的信息,及用户使用的信 息。管理员可以根据站点流量信息控制Web缓存、负 载平衡和网络构架等问题。 三、远程教育个性化授导系统构架 远程教育个性化授导本质上是学习者个性化服务 的过程,以学习者需求为中心,满足需要的过程。包 括两个方面,其一是根据学习者特征提供丰富的个性 的学习资源服务一“授”;其二是提供学习过程支持 服务,即学习指导——“导”。图1是个性化授导的 实质:D是不同的学习者通过各种途径使用学习资源, 即学习过程。B是系统跟踪学习者学习过程,创建学 习者访问模型,创建学习者个性数据库。最后系统根 57 维普资讯 http://www.cqvip.com

设备与技术 据动态的学习者模型调整系统资源,满足个性化需求, 即图中C。图中的A是远程授导最为重要的方面,对 学习者的学习过程挖掘之后,反馈给当前学习者适当 f总第56期J教育传播与技术2008.1 基于Web挖掘的模块。基于Web挖掘的模块从 Web服务器上获取学习者学习的动态信息,一股来说, 以Web的使用挖掘为主。在对服务器的学习者访问日 志路径进行补充之后,将对数据进行预处理。清除那 些与挖掘无关的信息项,识别用户,对事务合理地切 片,最后得到的是学生访问信息的原始信息立方体数 的学习建议,应用个性化指导策略指导其完成能力的 拓展以及个性的发展。 据库。该数据库数据庞大,需要按模式进一步发现与 分析。应用关联规则分析、分类和聚类技术、序列模 D 图1个性化授导实质 将个性化授导实质具体化,把基于Web的数据挖 掘应用于远程个性化服务之中,图2是构建远程个性 化授导的模型。 图2远程教育个性化授导模型 此模型分为几个模块,首先远程教育系统向学习 者提供丰富的资源,包括课件库、作业库、答疑库、 案例库等。这些资源以知识点为核心进行组织,统称 知识库。知识库通过Web服务器调度知识点内容给学 习者使用。 个性库模块。该系统建立学习者的个性化特征库, 其一是保存学习者的静态资料,如学习者姓名、I【)、 密码、性别、昵称、E—mail等,其二是学习者的知识 结构、学习风格、学习历史、课业完成情况等动态信 息。静态信息一般是不会发生变化的,提供进入系统 的入口。动态信息随着学习者学习过程的进行会发生 质的变化。在学习开始之前让学习者通过Web提交一 组自己动态信息的问答表,该问答表包括学习者学习 风格类型、知识结构等学习特征的属性值,之后系统 会利用数据挖掘模块不断完善其模型特征。 58 式等数据挖掘算法处理学生访问立方体数据库,通过 可视化等模式分析技术把挖掘结果以学习者可以理解 和接受的方式呈现,不断完善补充学习者个性模型, 同时通过Web服务器反馈给学习者合适的学习策略 和学习建议。 Web服务器模块。学习者通过访问Web服务器获 取知识,Web挖掘处理后的应用模式作用于Web服务 器,在知识库中挑选适合学习者个性的知识,同时为 其提供合理的学习策略和学习建议。 最后,学习者通过Web服务器访问学习资源,看 到的是根据其个性定制的学习环境。 四、结束语 远程教育的个性服务已经成为远程教育提高教 育、教学质量的一个共识。本文对基于Web的挖掘过 程、挖掘的算法、挖掘模式进行了分析,讨论了基于 Web的数据挖掘在远程教育个性化授导空间应用的切 合点,分析了个性化授导的实质,构建了远程教育个 性化授导模型。 远程教育个性化授导是教育发展的必然要求,本 文提出了模型的构建模块,需要进一步从技术角度来 细化,在编程层面上实现。 参考文献 [1][英]丹尼尔,丁兴富译.巨型大学与知识媒体[M].上海: 上海高等教育电子音像出版社,2003年 [2]韩玲.网络教学中学习者行为间隔的量化分析与反思 [J].中国远程教育,2005(6) [3]顾侠强.教师“导”学的理论与实践初探[J].中国远程教 育,2005(5) [4]吴维屏.教育个性化背景下的远程教育[J].现代教育技术, 2003(6) [5]赵建军.Web数据挖掘[J].电脑知识与技术,2005(5) 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- 517ttc.cn 版权所有 赣ICP备2024042791号-8

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务