软件工程数据挖掘存在的挑战与解决方案

3.0 闻远设计 2024-03-13 51 4 14.55KB 3 页 免费
侵权投诉
软件工程数据挖掘存在的挑战与解决方案
1 引言(Introduction
数据挖掘技术既是在海量的数据当中将需求信息挖掘出来的过程[1].软件工程数据挖掘则是数
据挖掘技术在软件工程领域的重要应用[2].软件工程数据挖掘技术可以有效地提高软件的开发
效率,增强软件的稳定性以及可用性,随着软件工程数据挖掘技术的不断提升,其应用范围更
加的广泛[3].因此,对其的研究工作不仅具有重要的学术价值,更具有重大的实际应用价值。
本文重点探索软件工程数据挖掘技术面临的挑战以及将来的发展趋势。
2 软件工程数据挖掘(Software engineering datamining
1)软件工程数据挖掘的必要性
软件工程数据主要是指在软件开发阶段积累的相关数据,其中包括软件的可行性分析以及需求
分析文本,软件的注释或者代码等等。这些信息是软件开发者获取软件相关数据的唯一来源。
随着软件研发技术以及规模的不断提升,其中包括的软件工程数据也是成指数性增长。例如:
Linux 操作系统软件,其仅代码一项就超过了 500 万行。这在无形中增加了软件开发者获取软
件相关数据的难度。因此,借助于数据挖掘技术的软件工程信息搜索技术是十分必要的。
2)软件工程数据挖掘任务及其过程
一般来讲,软件工程的数据挖掘工作主要包括:
a.软件数据的预处理。这一过程主要是将未曾加工的数据变为便于挖掘出来的形式。其主要涉
及到不同来源以及格式数据的融合,进而转化成为统一格式的数据。选取数据挖掘任务有关的
数据记录,并对数据中的噪音以及重复值进行清理。目前,数据挖掘的预处理技术主要采用的
LSAPLSALDA 等。
b.数据挖掘。这一过程主要是要将海量数据中能够反映出软件本质或者规律的信息搜取出来。
其中运用了大量的算法。输入的是结构规整的数据,而将关联、分类等信息模式进行输出,这
些信息模式与挖掘任务有关。
c.结果评估。这一过程的目的就是要是用户获得有用的信息。主要包括提出信息质量不高的部
分结果数据,以及将计算机处理以及理解的信息模式转换成为用户能够理解的信息模式,并传
递给用户。
2 软件工程数据挖掘存在的挑战(Challenge ofsoftware engineering data mining
1)软件工程数据复杂度高
目前的软件工程数据主要包括结构化和非结构化两类数据。其中,结构化数据主要涉及到软件
的版本相关信息以及缺陷报告等。非结构化数据主要包括一些软件代码、文档等。这两类数据
不能采取同一种算法,但是两类数据之间却又存在着诸多相关性。因此,在数据挖掘算法开发
上,要充分的考虑到两类数据的复杂联系,无形中增加了不小的难度。
2)分析方法并非传统模式
软件工程数据挖掘工作的最后阶段是将获取的挖掘信息呈现给所需用户。在传统的数据挖掘应
用过程中,例如:银行或者电子商务,都是将其转化为文字或者图表的形式。但是,软件开发
者所需的信息并没有如此简单。其囊括了编程模板、缺陷定户信息。因此,这对数据挖
掘技术提出了更高要求。
3)数据挖掘结果评价标准不一
摘要:

软件工程数据挖掘存在的挑战与解决方案1引言(Introduction)数据挖掘技术既是在海量的数据当中将需求信息挖掘出来的过程[1].软件工程数据挖掘则是数据挖掘技术在软件工程领域的重要应用[2].软件工程数据挖掘技术可以有效地提高软件的开发效率,增强软件的稳定性以及可用性,随着软件工程数据挖掘技术的不断提升,其应用范围更加的广泛[3].因此,对其的研究工作不仅具有重要的学术价值,更具有重大的实际应用价值。本文重点探索软件工程数据挖掘技术面临的挑战以及将来的发展趋势。2软件工程数据挖掘(Softwareengineeringdatamining)(1)软件工程数据挖掘的必要性软件工程数据主要是...

展开>> 收起<<
软件工程数据挖掘存在的挑战与解决方案.docx

共3页,预览1页

还剩页未读, 继续阅读

相关推荐

作者:闻远设计 分类:其它行业资料 价格:免费 属性:3 页 大小:14.55KB 格式:DOCX 时间:2024-03-13

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 3
客服
关注