首页 > 人才培养 > 本科教育 > 教学大纲 > 正文

《人工智能的数学基础》《Mathematical Basis of Artificial Intelligence》教学大纲

    作者: 发布时间: 2025-11-06 11:07 访问次数:

《人工智能的数学基础》《Mathematical Basis of Artificial Intelligence》教学大纲

制定时间:2025 2

一、课程基本信息

)适用专业

智能科学与技术

)课程代码

 

(三)学分/课内学时

3学分/48学时

)课程类别

专业教育

)课程性质

必修/理论课

)先修课程

《线性代数》、《高等数学》、《概率论与数理统计》等

)后续课程

《深度学习》、《强化学习》、《毕业设计》等

二、课程教学目标

课程定位

《人工智能的数学基础》是智能科学与技术等专业的专业必修课,是人工智能领域的核心先导课程,旨在为学习者构建支撑AI理论与技术的数学知识体系。课程定位于连接基础数学与AI应用的桥梁,面向具备高等数学、线性代数基础的学生,聚焦于机器学习、深度学习等AI分支中不可或缺的数学工具。内容涵盖概率统计(贝叶斯推理、分布建模)、优化理论(梯度下降、凸优化)、线性代数(矩阵分解、张量运算)、信息论(熵与编码)以及图论(网络结构与知识图谱),通过理论推导与实例解析(如反向传播的链式法则、主成分分析的矩阵分解),揭示数学原理在模型设计、算法优化中的底层逻辑。课程强调数学形式化思维与工程问题建模能力的双重培养,为后续《机器学习》《计算机视觉》等应用型课程奠定严格的数理基础,助力学生从“调参实践”向“原理创新”进阶。

总体目标

《人工智能的数学基础》课程旨在构建支撑人工智能核心技术的关键数学能力体系,培养学习者从数学本质理解算法原理、优化模型及解决复杂问题的思维模式。通过系统学习概率论与统计推断(如贝叶斯网络、马尔可夫链)、线性代数与张量运算(如特征值分解、矩阵求导)、凸优化理论(如梯度下降、拉格朗日对偶性)以及信息论(如熵、KL散度)等核心内容,学生能够掌握AI模型设计的数学逻辑(如神经网络反向传播的微分链式法则、注意力机制的权重分配原理),并具备将数学公式转化为代码实现的能力。课程强调从数学严谨性出发,提升对算法泛化性、可解释性的分析能力,为机器学习、深度学习等高阶课程奠定理论根基,同时助力解决工业场景中的模型调优、数据分布建模等实际问题,推动从“应用调用”到“理论突破”的创新能力进阶。

教学目标

本课程旨在系统构建学生支撑人工智能技术的核心数学能力,聚焦概率统计、线性代数、优化理论与信息论等领域的核心工具,培养从数学本质理解算法原理的思维模式。通过理论推导与实例解析(如反向传播的微分链式法则、主成分分析的矩阵分解),学生能够掌握数学形式化语言描述模型的能力,理解算法设计的数学逻辑(如梯度下降的收敛性、贝叶斯推断的统计基础)。同时,课程强调数学理论与工程实践的融合,训练学生将复杂问题建模为数学优化问题(如分类任务转化为概率分布拟合问题),并利用工具(如NumPyPyTorch)实现数学公式的代码化验证,为深度学习、自然语言处理等应用课程奠定严格的数理基础,助力从调参实践理论创新的思维跃迁。

1.具体目标

目标1数学工具的形式化表达与推导能力掌握概率论(贝叶斯定理、马尔可夫链)、线性代数(矩阵分解、张量运算)等核心数学工具,能够严格推导AI算法的数学原理(如神经网络的梯度更新公式、注意力机制的权重分配原理)

目标2:数学建模与算法优化能力:能够将实际问题转化为数学优化问题,掌握凸优化、信息论(熵、KL散度)等工具设计高效算法并验证理论性能。通过案例驱动,强化从建模、求解到工程落地的全链路能力。

2.课程目标与毕业要求的对应关系

毕业要求

毕业要求指标点

课程

目标

教学

单元

评价

方式

1. 掌握专业必需的数学、自然科学、工程基础和专业知识,能够用于解决智能系统开发中的复杂工程问题。

1.3:智能科学与技术专业的基本理论、基本知识,掌握扎实的工程基础知识

目标1

1-7

平时作业,实验,

试卷考核

4. 能够基于科学原理,采用适当的工程方法对智能系统的复杂工程问题进行研究,包括系统方案设计、分析与解释数据、并通过信息综合得到合理有效的结论。

4.2: 能够基于智能科学与技术专业相关理论和对象特征,选择研究开发路线和设计可行的系统方案。

目标2

4-6,8

平时作业,实验,

试卷考核

 

三、教学内容与方法

(一)教学内容及要求

教学

单元

教学内容

学习产出要求

推荐学时

推荐教学方式

课程

目标

备注

1

代数学和分析学的基本概念

代数学:向量,范数,矩阵,行列式的定义和性质。

分析学:极限、连续性的定义和性质。

1掌握向量,范数,矩阵,行列式的基本运算规则。

2能基于连续性分析,证明简单优化问题(如线性回归)解的存在性,并解释激活函数连续性与模型稳定性的关联。

4

讲授

1


2

微积分的基础概念

单变量微积分:导数、微分、泰勒展开,梯度与极值判定。

多变量微积分:偏导数、方向导数、梯度向量与Hessian矩阵。

1能准确定义导数、微分与泰勒展开的数学意义,解释其在函数局部线性逼近中的作用。

2能计算多项式、指数、对数等基本函数的导数与微分,推导简单复合函数的链式法则。

4

讲授

1


3

矩阵与线性变换

矩阵运算:加法、乘法、转置,张量的多维表示。

线性变换:基变换、特征值/向量,仿射变换的几何意义。

1掌握矩阵的基本操作,比如加法、乘法和转置。

2能计算矩阵的特征值和特征向量,理解矩阵乘法与线性变换的关系。

3理解基变换如何改变坐标系。

4基础工具实验:熟悉Python/Matlab基础、NumPy/Pandas数学库操作(矩阵运算、概率分布可视化)

4

讲授、实验

1


4

矩阵分解

核心分解:SVD(奇异值分解)、QR分解、LU分解的原理与数值稳定性。

应用场景:SVD用于推荐系统协同过滤,QR分解求解线性方程组。

1理解SVD、QR、LU分解的数学原理与数值稳定性,能编程实现图像/数据压缩;

2解释协同过滤与线性方程组求解的分解应用,分析不同场景下分解方法的选择依据。

8

讲授、实验

1,2


5

最优化理论与算法

凸优化基础:凸集、凸函数、拉格朗日对偶性,KKT条件。

算法设计:梯度下降、牛顿法、Adam优化器的收敛性证明。

1掌握凸优化问题的数学建模与对偶转化,能推导KKT条件求解带约束优化

2对比梯度下降、牛顿法与Adam的收敛性差异,编程实现并分析参数对算法性能的影响。

3理解并掌握神经网络的权重更新策略。

8

讲授、实验

1,2


6

概率模型

概率基础:随机变量及分布,随机变量的数字特征。

极限理论:大数定律,中心极限定理。

参数估计:最大似然估计,贝叶斯估计

1掌握随机变量分布特性及期望方差计算。

2应用大数定律分析蒙特卡洛模拟收敛性。

3能推导最大似然估计并实现贝叶斯参数推断,解释其在模型训练与不确定性量化中的作用。

8

讲授、实验

1,2


7

信息论的基础概念

核心度量:熵、交叉熵、KL散度、互信息的定义与性质。

1掌握信息熵、交叉熵与KL散度的计算,能应用互信息进行特征选择

2能计算图像数据集各通道的信息熵,设计基于互信息的特征选择策略提升分类模型准确率。

4

讲授、实验

1


8

信息论在机器学习中的应用

应用场景:KL散度在机器学习中的应用、模型压缩(熵编码)

1能解释KL散度在变分自编码器(VAE)正则化中的作用,并通过调整KL权重参数分析生成图像质量的平衡关系

8

讲授、实验

2


(二)教学方法

1.课堂讲授

课堂讲授的目的是使得学生能从数学本质理解算法原理、优化模型及解决复杂问题的思维模式。本课程共设置8个课堂讲授单元,具体特点如下:

1)采用启发式教学,激发学生主动学习的兴趣,培养学生独立思考、分析问题和解决问题的能力,引导学生主动通过实践和自学获得自己想学到的知识。

2)在教学内容上,采用数学-AI双视角教学,避免孤立讲授数学,始终以AI问题为锚点。通过猜想-验证-改进模式引导学生探索数学本质。从基础数学工具(微积分、矩阵分解)到高阶模型(VAE、强化学习),建立公式代码系统的完整链路。

3)在教学过程中采用电子教案、CAI课件、多媒体教学与传统板书、教具教学相结合,提高课堂教学信息量,增强教学的直观性。

4)理论教学与工程实践相结合,引导学生应用数学、自然科学和工程科学的基本原理,为具备解决相关工程问题思维方法和实践能力奠定基础。

6)课内讨论和课外答疑相结合,每个月至少进行一次答疑。

2.实验教学

实验教学的目的是培养学生掌握AI模型设计的数学逻辑,并具备将数学公式转化为代码实现的能力,建立公式代码系统的完整链路。本课程共设置6个实验单元,包括

  1. 基础工具实验Python/Matlab基础、NumPy/Pandas数学库操作(矩阵运算、概率分布可视化);(2课时)

  2. 核心算法验证线性回归、梯度下降实现、贝叶斯分类器推导、SVM优化问题求解;(6课时)

  3. 综合应用项目基于概率图模型的简单推理、神经网络反向传播手写推导与代码实现。(4课时)

具体特点如下:

1数学公式与代码的双向映射:实验设计紧扣数学理论,要求学生将抽象公式转化为可执行代码,同时通过实验结果反向验证数学原理。

2真实场景与数据集驱动:使用Kaggle或公开数据集(如MNISTCIFAR-10),在图像分类任务中应用PCA降维,分析数学工具对模型效率的提升。

3可视化与交互式分析:利用MatplotlibPlotly绘制损失函数曲面、梯度下降轨迹,直观展示优化过程(如对比SGDAdam的收敛路径)。

4独立性和完整性:实验由学生独立完成并撰写相应的实验报告,力图使得每个同学都能建立公式代码系统的完整链路。

5严格的可复现性要求:要求实验代码模块化,附带详细数学注释。报告需包含数学推导、结果可视化与工程反思。

四、考核及成绩评定

(一)考核内容及成绩构成

课程考核以考核学生能力培养目标的达成为主要目的,以检查学生对各知识点的掌握程度和应用能力为重要内容,包括平时考核和期末考核两个部分。平时考核采用实验报告方式评定学生成绩;期末考核采用期末考试评定学生成绩。各课程目标的考核内容、成绩评定方式、目标分值建议如下:

课程目标

考核内容

成绩评定方式

成绩占总评分比例

目标成绩占当次考核比例

学生当次考核平均得分

目标达成情况计算公式

目标1数学工具的形式化表达与推导能力掌握概率论(贝叶斯定理、马尔可夫链)、线性代数(矩阵分解、张量运算)等核心数学工具,能够严格推导AI算法的数学原理(如神经网络的梯度更新公式、注意力机制的权重分配原理)

1. 向量,范数,矩阵,行列式的基本运算规则

2. 计算矩阵的特征值和特征向量

3. 矩阵分解步骤复现

4. 梯度下降、牛顿法、Adam优化器的收敛性证明。

5. 能推导最大似然估计并实现贝叶斯参数推断

实验1

5%

100%

A1

实验2

5%

100%

A2

期末考试

40%

70%

A3

目标2:数学建模与算法优化能力:能够将实际问题转化为数学优化问题,掌握凸优化、信息论(熵、KL散度)等工具设计高效算法并验证理论性能。通过案例驱动,强化从建模、求解到工程落地的全链路能力。

1. 对比梯度下降、牛顿法与Adam的收敛性差异

2. 解释线性方程组求解的分解应用,分析不同场景下分解方法的选择依据。

3. 计算图像数据集各通道的信息熵,设计基于互信息的特征选择策略提升分类模型准确率。

实验3

10%

100%

B1

实验4

5%

100%

B2

实验5

5%

100%

B3

实验6

10%

100%

B4

期末考试

20%

30%

B5

总评成绩(100%=平时实验(40%+期末考试(60%

100%

——

——

(二)平时考核成绩评定

1.平时实验

本课程共设计实验6次,其中6次需要提交实验报告,支撑目标1和目标2,共占总评分40%,其中目标1占10%,目标2占30%。对应目标的评分标准如下:

对应目标

目标1:数学工具的形式化表达与推导能力:掌握概率论(贝叶斯定理、马尔可夫链)、线性代数(矩阵分解、张量运算)等核心数学工具,能够严格推导AI算法的数学原理(如神经网络的梯度更新公式、注意力机制的权重分配原理)

目标2:数学建模与算法优化能力:能够将实际问题转化为数学优化问题,掌握凸优化、信息论(熵、KL散度)等工具设计高效算法并验证理论性能。通过案例驱动,强化从建模、求解到工程落地的全链路能力。

成绩比例

40%

考查点

实验内容完成情况

实验报告情况

评分标准

100%

至90%

根据实验要求实现主要功能,同时完成附加任务要求。实验态度认真,充分理解实验要求,解决问题能力强,沟通协作能力很好。

实验报告完整,内容丰富、图文并茂,文字足够且正确,对实验方案有自己独到的思路与见解。

89.9%

至80%

根据实验要求实现主要功能。实验态度认真,理解实验要求,解决问题能力较强,沟通协作能力较强。

实验报告较完整,内容较丰富、图文并茂,文字足够且基本正确,对实验方案有自己的思路与见解。

79.9

至70%

根据实验要求基本实现主要功能。实验态度较为认真,基本理解实验要求,解决问题能力一般,沟通协作能力一般。

实验报告较完整,内容较丰富,文字内容足够且基本正确。

69.9%

至60%

根据实验要求实现主要功能但有一些遗漏。实验态度一般,基本理解实验要求,解决问题能力一般,沟通协作能力一般。

实验报告基本完整,内容基本够,有少量错误。

59.9%至0

无法实现主要功能,同时完成附加任务要求。实验态度认真,充分理解实验要求,解决问题能力强,沟通协作很好。

实验报告未完成,内容不够,错误多。

 

五、参考学习资料

课程教材:人工智能数学基础,廖盛斌著,电子工业出版社,20239月,ISBN9787121463075

推荐教材1:人工智能数学基础,唐宇迪著,北京大学出版社,202010月,ISBN9787301314319

推荐教材2:人工智能的数学基础,冯朝路著,清华大学出版社,20228月,ISBN9787302603818