《语音识别技术(Speech Recognition Technology)》教学大纲
制定时间:2025 年 7 月
一、基本信息
(一)适用专业:智能科学与技术
(二)课程代码:3ZN1019A
(三)学分/课内学时:4学分/64学时
(四)课程类别:专业教育
(五)课程性质:选修
(六)先修课程:《高等数学》、《概率论》、《线性代数》、《机器学习》、《深度学习》、《人工智能》等
(七)后续课程:《毕业设计》
二、课程教学目标
本课程涵盖语音识别的基本原理、关键技术和应用场景,旨在帮助学生全面了解语音识别技术。掌握语音信号处理、特征提取、声学模型、语言模型和解码器等核心技术,并了解其在实际应用中的作用。
(一)课程目标1:在课程中全面讲解语音识别的相关基础知识、应用场景以及相关框架。同时熟悉并掌握一些经典的语音识别算法和与语音识别模型。让学生产生对语音识别的兴趣,明白语音识别技术在现实研究和应用中的重要价值。对应毕业要求4。
(二)课程目标2:针对不同的语音识别场景,能够选择合适的语音识别算法完成相关语音识别任务。同时掌握提高语音识别任务性能的方法。具备根据具体的语音识别场景选择相应的算法并编程实现,再到能够提升语音识别性能的能力。对应毕业要求5。
(二)课程目标与毕业要求的对应关系
毕业要求 |
毕业要求指标点 |
课程目标 |
教学单元 |
评价方式 |
3.能够设计针对智能科学与技术领域复杂工程问题的解决方案,设计满足特定需求的智能科学与技术应用系统,并能够在设计环节中体现创新意识,考虑社会、健康、安全、法律、文化以及环境等因素。 |
3.2 能够进行智能科学与技术应用系统的解决方案设计、设备选型和系统集成,优选方案,体现创新意识; |
目标1 |
语音识别概论;语音识别基础理论;语音识别的应用与展望 |
平时作业; 实验 |
4.能够基于科学原理,采用适当的工程方法对智能科学与技术领域的复杂工程问题进行研究,包括设计实验、分析与解释数据、并通过信息综合得到合理有效的结论。 |
4.2能够正确采集和整理实验数据,对实验结果进行分析和解释,获取有效结论; |
目标2 |
语音特征提取与识别;语音识别训练实战 |
实验; 期末考试 |
三、教学内容
序 号 |
教学单元 |
教学内容 |
学习产出要求 |
推荐学时 |
推荐教学方法 |
支撑课程目标 |
备注 |
1 |
语音识别概论 |
语音识别的定义、原理、分类及历史回顾等 |
了解语音识别的发展历史、意义与重要性。 |
2 |
讲授和研讨 |
1 |
|
2 |
什么是语音 |
语音学;发音语音学;声学语音学;感知语音学。 |
从发音、声学和感知学了解语音的共性与个性。 |
2 |
讲授,案例 |
1 |
|
3 |
语音识别基础理论 |
统计语音识别、有限状态机、隐变量模型、人工神经网络和深度学习。 |
了解并掌握各种语音识别基本方法的原理以及思想理论。 |
16 |
讲授,案例 |
1、2 |
|
4 |
语音特征提取与识别 |
语音特征提取、语言模型、搜索算法、WFST进行语音识别、语义分析 |
了解并掌握语音特征提取方法以及各种语音识别模型的原理、训练,并会适用典型的识别算法进行语音识别。 |
18 |
讲授, 研讨 |
1、2 |
|
5 |
语音识别训练实战 |
熟悉语音提取软件Praat、程序设计软件MATLAB或Python、实战语音诊断帕金森疾病、实战语音识别英文字符。 |
掌握语音提取软件和语音识别编程工具以及软件库,并在语音识别方面进行应用尝试和开发研究。 |
24 |
实验、操作 |
1、2 |
|
6 |
语音识别的应用与展望 |
语音识别技术的应用与展望 |
了解语音识别的应用与展望 |
2 |
讲授、研讨 |
1 |
|
(二)教学方法
1.本课程宜采用教师多媒体演示和板书相结合的教学方式,拟在教室完成;
2.注重理论指导的作用,同时贯彻理论和实践相结合的原则,给学生出一定量的思考,并要求学生完成一定量的思考作业,以提高学生的理论水平,培养学生的思考能力和创新精神。
3.把握课程的重难点,及时总结深化所学内容,并针对重难点布置适当的综合练习。以便达到良好的教学效果。
4.在讲授知识的同时,注重知识应用的讲解。
四、考核及成绩评定
(一)考核内容及成绩构成
课程考核以考核学生能力培养目标的达成为主要目的,以检查学生对各知识点的掌握程度和应用能力为重要内容,包括平时作业、实验和期末非标准试卷三个部分。各课程目标的考核内容、成绩评定方式、目标分值建议如下:平时成绩占10%,实验占30%,期末考核占60%。
课程目标 |
考核内容 |
成绩评定方式 |
成绩占总评分比例 |
目标成绩占当次考核比例 |
学生当次考核平均得分 |
目标达成情况计算公式 |
目标1:在课程中全面讲解语音识别的相关基础知识、应用场景以及相关框架。同时熟悉并掌握一些经典的语音识别算法和与语音识别模型。让学生产生对语音识别的兴趣,明白语音识别技术在现实研究和应用中的重要价值。 |
理解技术的概念,掌握各类识别方法。 |
实验 |
15% |
50% |
A1 |
|
掌握一些经典的语音识别算法和与语音识别模型 |
平时作业 |
10% |
100% |
B1 |
目标2:针对不同的语音识别场景,能够选择合适的语音识别算法完成相关语音识别任务。同时掌握提高语音识别任务性能的方法。具备根据具体的语音识别场景选择相应的算法并编程实现,再到能够提升语音识别性能的能力。 |
选择合适的语音识别算法完成相关语音识别任务 |
实验 |
15% |
50% |
A2 |
|
根据具体的语音识别场景选择相应的算法并编程实现,能够提升语音识别性能的能力 |
期末考试(非标试卷考核) |
60% |
100% |
C1 |
总评成绩(100%)=实验(30%)+平时作业(10%)+期末考试(60%) |
100% |
—— |
—— |
|
(二)平时考核成绩评定
平时作业:共1次,支持目标1,占总评分10%。
平时作业由学生自行查找有关语音识别技术相关资料,分小组进行学习并制作ppt,教师评阅后给出学生平时成绩。
对应目标的评分标准如下:
对应目标 |
目标1:语音识别的相关基础知识、应用场景以及相关框架。同时熟悉并掌握一些经典的语音识别算法和与语音识别模型。 |
考查点 |
相关基础知识。 |
成绩比例 |
100% |
评分标准 |
100% 至 90% |
优秀:了解基本知识,对技术有深刻理解,给出专业评述 |
89.9% 至 80% |
良好:了解基本知识,对技术有较好理解,给出较为专业评述 |
79.9% 至 70% |
中等:了解基本知识,对技术有理解,给出评述 |
69.9% 至 60% |
及格:了解基础知识,对技术部分有理解 |
59.9%至 0 |
不及格:不了解或只能部分了解相关技术 |
实验:必做实验8次。实验8次共占总评分30%。对应目标的评分标准如下:
对应目标 |
目标1:在课程中全面讲解语音识别的相关基础知识、应用场景以及相关框架。同时熟悉并掌握一些经典的语音识别算法和与语音识别模型。让学生产生对语音识别的兴趣,明白语音识别技术在现实研究和应用中的重要价值。 |
目标2:针对不同的语音识别场景,能够选择合适的语音识别算法完成相关语音识别任务。同时掌握提高语音识别任务性能的方法。具备根据具体的语音识别场景选择相应的算法并编程实现,再到能够提升语音识别性能的能力。 |
考查点 |
实验操作内容 |
实验操作内容 |
总评分占比 |
50% |
50% |
评分标准 |
100% |
能独立完成环境配置,准确采集/预处理语音数据,参数调试完全符合实验要求。代码结构清晰且有创新优化。 |
准确识别场景特征(如噪声类型/语种/领域术语),提出3种以上适配算法方案。提出创新优化方案(如自适应降噪算法),实验报告含定量对比与可视化分析。 |
至 |
90% |
89.90% |
在少量提示下完成环境搭建,数据预处理存在轻微瑕疵但不影响整体实验。正确实现核心算法但缺少优化,代码功能完整但可读性一般。 |
能分析场景核心需求,提供2种可行算法选择。文档完整记录调优过程,含不同方案效果对比。 |
至 |
80% |
79.9 |
需要多次指导完成环境配置,数据处理存在可修正的明显错误。能实现基础特征提取模块,核心算法部分依赖现成代码库。 |
识别主要场景特征但分析不够深入,算法选择单一,常规优化记录,缺乏量化分析。 |
至 |
70% |
69.90% |
关键步骤缺失,需逐步指导才能完成基础操作。仅能调用现成API,无法解释算法内部逻辑。 |
场景特征识别存在偏差,算法选择与场景需求部分脱节,文档仅描述基础操作步骤。 |
至 |
60% |
59.9%至 |
无法完成基本环境搭建或数据采集。算法实现存在根本性错误或未完成。 |
未能建立场景与算法的关联,未提交有效文档。 |
0 |
(三)期末考核成绩评定
参见非标准答案期末考试试题及评分标准。
五、参考学习资料
[1] 荒木雅弘.图解语音识别.北京:人民邮电出版社.2020.04.
[2] 张雄伟.智能语音处理.北京:机械工业出版社.2020.10.
[3] 洪青阳.语音识别:原理与应用.北京:电子工业出版社.2020.07.