机器学习
100775 机器学习
一、总述
1. 教材
-
Tom M. Mitchell (1997). Machine Learning. McGraw-Hill Education.
-
周志华. (2016). 机器学习. 清华大学出版社.
-
雷明. (2019). 机器学习原理、算法与应用. 清华大学出版社.
-
李航. (2012). 统计学习方法. 清华大学出版社.
注:以上为老师在课件中给出的参考资料,上课时以 PPT 为主。同时老师也推荐了吴恩达的机器学习课程。
2. 作业
2022 年春季学期的机器学习课程共包括 3 次实验,实验为组队完成,组员人数为 1-4 人。实验包括基础内容和加分内容。
每个小组需要在 3 次实验中选取 1 次实验进行课堂展示,每次实验的展示名额有限,先到先得。
实验内容如下。
-
实验 1 回归实验
-
基础内容
自行选取一个数据集进行回归预测。PPT 给出的实验流程包括数据预处理、模型选取与构建、训练与测试、可视化展示、优化与总结,下同。
-
加分内容
自行实现回归模型而不是调库;对调参(如学习率和正则化参数)进行讨论;特征工程等。
-
实验 2 分类实验
-
基础内容
自行选取一个数据集进行图片分类,要求使用传统机器学习算法和深度神经网络,并进行对比。
-
加分内容
本次实验的加分内容较为具体,包括:
-
手写实现传统分类算法:朴素贝叶斯分类,并设计实现基于最小风险的贝叶斯决策算法,应用于 cifar10 图片分类任务。
-
手写实现传统分类算法:决策树,并分析基于问题数据集特征的树生成与剪枝方法,应用于 cifar10 图片分类任务。
-
深度学习:分析说明深度卷积神经网络模型的超参数,分析各个网络层作用,分析深度卷积神经网络模型的可解释性,可视化分析过程。
-
深度学习:自主设计搭建合适的深度卷积神经网络,说明设计思路,也可优化改进已有的网络模型结构。
-
-
实验 3 聚类实验
-
基础内容
自行选取一个数据集进行聚类。
-
加分内容
本次实验没有加分内容。
由于 2022 年春季学期正值上海疫情爆发,因此取消了期末考试,修改为期末报告进行期末考核。期末报告的要求如下(以下内容为老师发布的原文)。
-
总结 3 次实验的心得体会。
-
讨论作业遇到的问题,结合本课程的学习,提出可能改进的方案设想。
-
实现方案中的一些设想,并讨论结果。
-
自我评价(对于本课程学习的自我评价,想拿优的同学注意了,这里特别要说清楚自己在大作业及期末报告中所做的工作亮点)。
期末报告的字数不做限制。
3. 课堂
每次课程结束后老师会提一个问题来做考勤,提交方式为写在纸上上交。线上上课时提交方式为拍照发给助教。
授课安排如下。
-
1-15 周
-
线性模型
-
决策树
-
人工神经网络
-
实验 1 回归实验的课堂展示
-
深度学习
-
贝叶斯学习
-
集成学习
-
实验 2 分类实验的课堂展示
-
聚类
-
降维
-
强化学习
-
实验 3 聚类实验的课堂展示
-
16 周
-
复习答疑
-
17 周
-
原定为考试,2022 年春季学期由于疫情取消考试,因此同样为复习答疑
二、任课教师
1. 10001 Li
老师脾气很好,同学们数次在课程群中匿名冲塔(主要针对部分小组课堂展示超时问题)也没有生气。