首页 > 人才培养 > 本科教育 > 教学大纲 > 正文

《数据分析与挖掘技术(Data Analysis and Mining Technology)》教学大纲

    作者: 发布时间: 2025-11-06 11:27 访问次数:

数据分析与挖掘技术Data Analysis and Mining Technology)》教学大纲

制定时间:2025 7

一、课程基本信息

)适用专业:智能科学与技术

)课程代码:3ZN1013A

(三)学分/课内学时:3学分/48

)课程类别:专业教育

)课程性质:/理论课

)先修课程:《高等数学》、《线性代数》、《数据结构》、《概率论与数理统计》

)后续课程:《机器学习》、《深度学习

二、课程教学目标

课程定位:

《数据分析与挖掘技术》是智能科学与技术专业本科的一门专业必修课程,本课程中涉及的理论、原理、方法和技术有助于学生进一步学习其他专业课程。开设本课程的目的是加强学生对数据分析与挖掘工作原理的认识,同时打开学生以各自专业知识领域结合数据分析与挖掘的开创理念;掌握数据分析与挖掘的基本理论、基本方法和基本技术;提高大数据背景下的数据分析能力,为今后的继续深造和智能系统研制,以及进行相关的工作打下坚实的基础。

总体目标:

《数据分析与挖掘技术》是理论性较强,涉及知识面较广,方法和技术较复杂的一门学科。通过对本课程的学习,学生应掌握实现数据分析与挖掘的基本操作流程。具体要求是:学生在较坚实打好的数学基础(概率论与数理统计、矩阵论、高等数学、最优化方法等)上,能够利用这些数学手段对常用的一些数据分析与挖掘算法进行建模与理论推导;能针对具体的运用场景,分析并选择合适的数据分析与挖掘模型(聚类模型、分类模型、回归模型、关联模型);能够根据不同的应用场景以及数据分析与挖掘模型,选择合适的模型评估指标;能对不同的数据分析与挖掘模型所得结果进行分析并得出导致这种现象的可能原因;另外,学生还应该了解专家系统的基本概念、研究历史、系统结构、系统评价和领域应用。学生还应了解数据分析与挖掘对于日常生活生产的重要性,掌握数据分析与挖掘方法的相关概念及其相应的学习机制,几种典型类型的数据分析与挖掘系统的学习方法、功能和领域应用。

教学目标:

通过本课程学习,使学生对数据分析与挖掘的发展概况、基本原理和应用领域有初步了解,对主要技术及应用有一定掌握,启发学生对数据分析与挖掘的兴趣,培养知识创新和技术创新能力。数据分析与挖掘涉及数据分析与信息挖掘,与社管金融、辅助医疗、智慧交通和文本处理、语音识别有关,同时辅以生活或工程中的具体案例加以介绍。

此外,数据分析与挖掘技术已经成为了现代社会各个领域中不可或缺的工具之一,它可以帮助人们更好地理解数据、发现问题、预测趋势以及制定决策。通过学习,学生能够知道什么时候需要某种合适的数据分析与挖掘方法用于给定的问题,并能够选择适当的实现方法。

(一)具体目标

目标1掌握数据采集、清洗、预处理的核心技术(如缺失值处理、异常值检测);培养数据伦理意识,理解数据采集的合法性边界,建立 "数据安全无小事" 的底线思维

目标2掌握统计分析、机器学习模型构建方法(如回归分析、决策树);树立精益求精的工匠精神,在模型调参、特征工程中追求最优解,同时强化算法公平性意识,识别数据偏差对模型结果的潜在影响。

目标3能够根据不同的应用场景选择合适的模型,同时根据应用场景和模型评估指标对所得模型进行有效评估与选择,认识技术对民生改善的价值,增强用数据解决实际问题的社会责任感

(二)课程目标与毕业要求的对应关系

毕业要求

毕业要求指标点

课程目标

教学单元

评价方式

1.工程知识:能够将数学、自然科学、工程基础和专业知识用于解决复杂工程问题。

能够应用专业知识解决工程计算问题;具有一定的软件设计能力,将数学公式或模型使用计算机进行计算或近似计算

目标1

目标2

数据分析与挖掘技术方法论

平时作业

期末考查

2.问题分析:能够应用数学、自然科学和工程科学

的基本原理,识别、表达、并通过文献研究分析复杂工程问题,以获得有效结论。

能够正确表达一个工程问题的解决方案能够表达工程问题的解决方案或实验步骤以便实施;能够应用数学、自然科学和工程科学的基本原理证实解决方案的合理性能够应用数学、自然科学和工程科学的基本原理通过实验比较来验证解决方案的准确性和合理性,获得有效结论

目标2

目标3

数据分析与挖掘技术方法论&模型选择

平时作业

期末考查

3.设计/开发解决方案:能够设计针对复杂软件工程问题的解决方案,设计满足特定需求的软件系统、可复用模块或组件,并能够在设计环节中体现创新意识,考虑社会、健康、安全、法律、文化以及环境等因素。

能够针对特定场景完成数据结构、算法设计以及确定其实现方法的可行性

目标3

人工智能方法论&模型评估

平时作业

期末考查


三、教学内容与方法

(一)教学内容及要求

教学单元

教学内容

学习产出要求

推荐学时

推荐教学方式

支撑

课程目标

备注

1

数据分析与挖掘技术概述

数据分析与挖掘技术概述

了解数据分析与挖掘技术的基本概念,数据分析与挖掘技术的发展简史,理解人工智能和数据分析与挖掘技术的关系,重点掌握数据分析与挖掘技术的概念。

2

讲授

1


2

Python数据分析简介

数据分析工具及 Python 操作;结合 "数据工具使用规范",强调代码复用中的版权意识

了解数据挖掘技术相关的工具,掌握Python用于数据挖掘时的相关操作要求。

4

讲授

案例

实验

2

包含一次实验

3

数据探索

数据质量分析、数据特征分析、Python主要数据探索函数

了解数据质量评估包含的相关内容,掌握数据特征分析的相关方法以及Python相关数据探索函数的使用。

4

讲授

案例

23


4

数据预处理

数据清洗数据集成数据归约数据变换Python常见的数据预处理函数

了解数据分析与挖掘技术中数据预处理的基本要素和基本概念,掌握各种数据预处理方法的适用场景。

8

讲授

案例

实验

23

包含一次实验

5

知识挖掘之分类模型

分类模型简介、常见的分类模型(KNNSVM等)、分类模型评估指标

了解并掌握常用的数据分类模型;了解并掌握常用的数据分类模型评估方法,通过"算法公平性" 案例,讨论模型优化的社会影响。

4

讲授

案例

实验

23

包含一次实验

6

知识挖掘之回归模型

回归模型简介、常见的回归模型(线性回归、逻辑回归等)、回归模型评估指标

了解并掌握常用的回归模型;了解并掌握常用的回归模型评估方法。

6

讲授

案例

实验

23

包含一次实验

7

知识挖掘之聚类分析

聚类模型简介、常见的聚类模型(K均值聚类等)、聚类模型评估指标

了解并掌握常用的聚类模型;了解并掌握常用的聚类模型评估方法,引入 "社区画像聚类" 案例,讨论技术在社会治理中的应用价值

4

讲授

案例

实验

23

包含一次实验

8

知识挖掘之关联分析

关联模型简介、常见的关联模型(Apriori等)、关联模型评估指标

了解并掌握常用的关联模型;了解并掌握常用的关联模型评估方法,通过 "超市购物篮分析",讨论商业决策中消费者权益保护

4

讲授

案例

实验

23

包含一次实验

9

知识挖掘之时序分析

时序模型简介、常见的时序模型(ARMAARMAARIMA等)、关联模型评估指标

了解并掌握常用的时序模型;了解并掌握常用的时序模型评估方法。

4

讲授

案例

实验

23

包含一次实验

10

离群点检测

离群点检测简介与检测方法(简单统计描述、箱形图、3δ准则、聚类),离群点分析

掌握基本的离群点检测原理和方法,会分析离群点的成因及其背后的数据价值,通过 "金融欺诈检测" 案例,讨论技术在维护社会公平中的作用

2

讲授

案例

2


11

案例分析

通过案例分析的方式,串联讲解并实现两个数据分析与挖掘示例。

了解并实现某些场景下的数据分析与挖掘全过程。

6

案例

实验

3

包含一次实验

(二)教学方法

1.课堂讲授

1采用启发式教学,结合伦理案例、社会价值分析等内容,将育人元素融入理论讲解;通过小组讨论培养批判性思维

2)在教学内容上,系统讲授数据分析与挖掘所涉及的数据预处理维度约简知识挖掘以及模型选择评估的基本理论、基本知识和基本方法,使学生能够系统掌握用于解决智科系等相关专业工程复杂问题的专业基础知识。

3)在教学过程中采用电子教案、CAI课件、多媒体教学与传统板书、教具教学相结合,提高课堂教学信息量,增强教学的直观性。

4)理论教学与工程实践相结合,引导学生应用数学、自然科学和工程科学的基本原理,采用现代设计方法和手段,进行系统设计、图像处理、语音识别、自然语言处理等信息类专业相关工程问题提供思维方法和实践能力。

5)课内讨论和课外答疑相结合,每个月至少进行一次答疑。

2.案例分析

围绕数据伦理、社会影响等主题,设置专题案例,引导学生分析技术应用的利弊,增强责任意识。除布置一定数量的课后作业外,设置专题案例分析环节,以机构的解析法分析和设计为主线,培养学生逐步具有应用相关的编程语言MATLABPYTHON等)解决复杂工程问题中知识表示、推理和解决问题的能力,结合所研究课题进行报告和设计文稿的撰写,并清晰陈述观点和回答问题的能力。

3.实验教学

实验教学是数据分析与挖掘技术课程中重要的实践环节,目的是培养学生运用实验方法研究解决人工智能类专业复杂工程问题的能力。课程实验8个,各实验按照实验指导书的要求学生独立或分组完成,并提交实验报告。

四、考核及成绩评定

(一)考核内容及成绩构成

课程考核以考核学生能力培养目标的达成为主要目的,以检查学生对各知识点的掌握程度和应用能力为重要内容,包括平时考核和期末考核两个部分。平时考核采用平时作业、阶段测验、实验、小论文等方式评定学生成绩;期末考核采用笔试评定学生成绩。各课程目标的考核内容、成绩评定方式、目标分值建议如下:

课程目标

考核内容

成绩评定方式

成绩占总评分比例

目标成绩占当次考核比例

学生当次考核平均得分

目标达成情况计算公式

目标1:了解数据分析与挖掘技术的概念和数据分析与挖掘技术的发展,了解国内外数据分析与挖掘技术的基本情况,熟悉数据分析与挖掘技术的研究领域,培养数据伦理意识

技术概述及伦理认知

平时作业

10%

100%

A1

 

目标2:较详细地论述数据分析与挖掘技术的各组成部分及其主要方法。重点数据预处理和数据分析与挖掘相关的方法,培养严谨性与伦理意识

数据分析与挖掘方法基本操作的代表性算法原理、模型构建及伦理实践

实验成绩

15%

50%

B1

 

期末考查

30%

50%

C1

目标3:能够根据不同的应用场景选择合适的模型,同时根据应用场景和模型评估指标对所得模型进行有效评估与选择,增强社会责任感

模型应用及社会价值分析

实验成绩

15%

50%

B2

期末考查

30%

50%

C2

总评成绩(100%=平时作业(10%+实验(30%+期末考查(60%

100%

——

——

(二)平时考核成绩评定

1.课后作业:1次,支持目标1,共占总评分10%。对应的评分标准如下:

对应内容

了解数据分析与挖掘技术的概念和发展。

了解国内外数据分析与挖掘技术研究的基本情况。

熟悉数据分析与挖掘技术的研究领域

考查点

数据分析与挖掘技术的概念和发展

数据分析与挖掘技术的主要流派和国内外研究现状

人工智能的应用领域

总评分占比

30%

30%

40%

评分标准

100%

90%

阐述内容合理,对数据分析与挖掘技术的概念、流派与路线研究领域有非常好的描述,论文格式符合规范,字数在2000以上,基本是自己课程的理解

89.9%

80%

阐述内容合理,对数据分析与挖掘技术的概念、发展简史、研究领域等有较好的描述,论文格式符合规范,字数在2000字左右,基本是自己对课程的理解。

79.9

70%

阐述内容合理,对数据分析与挖掘技术的概念、发展简史、研究领域等有一定的描述,论文格式基本符合规范,字数在1500字左右,基本是自己对课程的理解。

69.9%

60%

阐述内容合理,对数据分析与挖掘技术的概念、发展简史、研究领域等有描述,论文格式基本符合规范,字数在1500字左右。

59.9%

0

阐述内容合理,对数据分析与挖掘技术的概念、发展简史、研究领域等描述不,论文格式不太符合规范,字数低于1200字。

 

2.实验:实验8次,支撑目标2、目标3共占总评分30%,目标215%、目标315%。对应目标的评分标准如下:

对应目标

目标2:较详细地论述对数据分析与挖掘技术中的各组成部分的主要方法。

目标3:能够根据不同的应用场景选择合适的模型,同时根据应用场景和模型评估指标对所得模型进行有效评估与选择。

考查点

实验操作与实验报告

实验操作与实验报告

成绩比例

15%

15%

评分标准

100%

90%

能够根据实验要求,能够把全部主要功能实现,并且对附加的任务要求也能完成。实验态度认真,操作能力强,操作、记录规范,沟通、协作很好,实验数据记录真实严谨,隐私保护措施到位,团队协作中主动承担任务。

在实验操作达标情况下,实验报告完整无遗漏,内容丰富、图文并茂,文字数量足够且正确,实验方案有自己独到的思路与见解,实验报告中社会价值分析深入,能结合场景提出负责任的应用建议

89.9%

80%

能够根据实验要求,能够把多数主要功能实现,并且对附加的少量任务要求也能完成。实验态度认真,操作能力强,操作、记录规范,沟通、协作很好,数据记录较完整,有基本隐私保护意识,能配合团队完成任务

在实验操作达标情况下,实验报告比较完整,内容比较丰富、图文并茂,文字数量足够且基本正确,实验方案有自己的思路与见解,社会价值分析较清晰,能认识模型的实际应用意义

79.9

70%

能够根据实验要求,能够把主要功能实现。实验态度认真,操作能力一般,操作、记录规范,沟通、协作一般,数据记录基本完整,对隐私保护有一定认知,团队协作无明显失误

在实验操作达标情况下,实验报告比较完整,内容比较丰富,文字内容足够且基本正确,社会价值分析简单,对模型应用意义有基本认知

69.9%

60%

能够根据实验要求,能够基本实现主要功能。实验态度认真,操作能力一般,操作、记录规范,沟通、协作一般,数据记录有缺失,隐私保护意识薄弱,团队协作参与度低

在实验操作达标情况下,实验报告基本完整,内容基本够,有少量错误,社会价值分析模糊,对模型应用意义认知不足

59.9%0

动手操作能力差;操作、记录不规范,不能完成实验要求,数据记录混乱或造假,无视隐私保护要求,不参与团队协作

在实验操作达标情况下,实验报告未完成,内容不够,错误多,无社会价值分析,对模型应用的社会影响无认知

 

五、参考学习资料

推荐教材1:《Python数据分析与挖掘实战(第二版)》,张良均机械工业出版社,20224ISBN9787111640028

推荐教材2:《Python数据挖掘与机器学习》,魏伟一清华大学出版社,20214ISBN9787302572992

推荐教材3:《深入浅出数据分析》,Michael Milton,电子工业出版社,201009月,ISBN9787121099409