北京石油化工学院2014届优秀毕业论文
毕业设计双选系统的设计与实现
计算机科学与技术 隋旭宗 指导教师 沙芸 副教授
摘 要 随着互联网的不断发展,各类信息管理系统已成为数字化校园建设的一部分。毕业设计双选是教学的重要环节,也是毕业设计质量提高的基本保证。目前,毕业设计双选的大部分工作仍需要人工完成。本文通过对当前选题流程及特点分析,设计并实现一个毕业设计双选系统,以完善教学体系,促进数字化校园的建设。
本系统的目的是:简化毕业设计选题申报流程,借助B/S方式,使师生能够不受时间、地域的限制,完成毕
业设计双选,并由指导教师向学生提供任务书。本系统的特点是:实现了题目及题目申报表的相似度计算。此功能借助Lucene完成分词操作,经过词频统计后,生成文档向量。系统实现了余弦相似度、Dice和Jaccard三种相似度计算方法。通过对不同算法的相似度比对结果进行评估,确定了相似度的阈值,并对这些结果进行讨论。
本系统为B/S结构,使用ASP.NET技术开发,拥有良好的用户体验。相似度比对能够快速有效地给出参考结
果,减少了教师出题过程中因检索题目相似度而消耗的时间。
关键词 毕业设计双选,文档向量,词频统计,文本相似度计算
1 绪论
1.1 研究背景和研究意义
毕业设计是高校教学任务的重要实践环节,是评估学生学位资格的依据之一。目前大多数院校仍沿用传统的选题方式,存在很大弊端。大部分学生不能从题目中了解到更多有效信息,很难评估题目的工作量和难易度。学生盲目选题,开题阶段不能顺利进行,教师需要修改甚至变更题目,给教师和学生增添了许多工作量。
随着毕业生人数逐年增加,毕业设计的题目数量也在增长[1],人工分配学生可能产生错误。此外,教师通过人工筛查的方式不易得知题目是否重复,产生许多雷同或是相同的任务内容在所难免。规范毕业设计的管理流程,提高选题效率,不仅有助于改善毕业设计质量,还可以节约人力、物力成本。设计并实现一个B/S结构的毕业设计选题系统[2],可以减轻教师的工作量,推动毕业设计工作进行。
数字化校园[3]最早是由麻省理工学院于上世纪70年代提出的。目前,西方发达国家的许多高校已经完成了数字化校园的建设工作。在毕业设计选题方面,英国的诺丁汉大学已经拥有了自己的毕业设计双向选择信息服务系统[4],欧美国家的一般大学均实现了在线选题,同时可以进行在线评审、讨论[5]等。
1.2 需要解决的问题
针对学校当前的选题流程,设计并实现一个具有以下功能的毕业设计双选系统: (1)教师出题,包括题目上传、查重及申报书相似度比对,给出相似度比对结果; (2)学生选题,按需求查看题目(申报书)信息及下载任务书;
1
毕业设计双选系统的设计与实现
(3)师生双选,并由教师上传任务书及任务书相似度比对,给出相似度比对结果。针对毕业设计的题目和申报书中的内容,比对题目历史信息及申报书相似度;
(4)综合比较各种文本相似度的计算方法,选择区分度更好的,应用在申报书的相似度比对中,对题目、内容进行查重。
要完成以上功能,需要解决以下三个关键问题:
(1)段落主题是文本相似度比对的基本前提,设计并实现一种提取段落主题的方法;
(2)申报书之间的相似度主要通过段落相似度来计算,设计并实现一种主题段落相似度比对的计算方法; (3)对系统结构和相似度算法的优化。
2 毕业设计双选系统总体设计
2.1 总体结构
毕业设计双选系统的主要用户有:教师、学生、系统管理员。针对各个用户的特点,将系统功能进行划分,如图2.1所示:
目
图2.1 毕业设计双选系统模块划分图
查重 题
申报书管理
学生信息查询
选管理
前学年
双
当
选题数上限
数据可见性
题目 申报
申报书 维护
双选信 息管理
任务书 上传
课题 双选
任务书 下载
系统参 数配置
选题信 息导出
高级权 限操作
毕业设计双选系统
2.2 E-R图
本系统涉及的实体、属性以及相互之间的关系如图2.2所示:
2
北京石油化工学院2014届优秀毕业论文
配置信息
图2.2 毕业设计双选系统实体及其联系图 m 选题结果
p 双选
题目
q 教师
m 修改
n
修改人 1
题目信息
学生
1 选题
n 申报书 m
2.3 动态模型
系统正常使用时,按照其涉及的主要事件及发生的先后顺序,脚本如下: □教师登录后,将申报书信息在页面上填写完毕。 □题目申报成功后,形成申报书,并交由教师审核。 □教师审核通过,此题目有效,学生可以看到此题目。
□学生登录后,向系统提交查询请求,如:按难易度降序排序。系统将查询结果显示给学生。 □学生提交选题申请,教师可以看到学生申请。 □教师通过学生信息,选择学生,如:张三。 □教师上传任务书,系统显示上传结果。 □学生提交下载任务书请求。
□系统与学生建立连接,将任务书发送至学生。 根据以上脚本,绘制事件追踪图如图2.3所示:
3