Skip to content

机器学习

100775 机器学习

一、总述

1. 教材

  1. Tom M. Mitchell (1997). Machine Learning. McGraw-Hill Education.

  2. 周志华. (2016). 机器学习. 清华大学出版社.

  3. 雷明. (2019). 机器学习原理、算法与应用. 清华大学出版社.

  4. 李航. (2012). 统计学习方法. 清华大学出版社.

注:以上为老师在课件中给出的参考资料,上课时以 PPT 为主。同时老师也推荐了吴恩达的机器学习课程。

2. 作业

2022 年春季学期的机器学习课程共包括 3 次实验,实验为组队完成,组员人数为 1-4 人。实验包括基础内容和加分内容。

每个小组需要在 3 次实验中选取 1 次实验进行课堂展示,每次实验的展示名额有限,先到先得。

实验内容如下。

  • 实验 1 回归实验

  • 基础内容

    自行选取一个数据集进行回归预测。PPT 给出的实验流程包括数据预处理、模型选取与构建、训练与测试、可视化展示、优化与总结,下同。

  • 加分内容

    自行实现回归模型而不是调库;对调参(如学习率和正则化参数)进行讨论;特征工程等。

  • 实验 2 分类实验

  • 基础内容

    自行选取一个数据集进行图片分类,要求使用传统机器学习算法和深度神经网络,并进行对比。

  • 加分内容

    本次实验的加分内容较为具体,包括:

    • 手写实现传统分类算法:朴素贝叶斯分类,并设计实现基于最小风险的贝叶斯决策算法,应用于 cifar10 图片分类任务。

    • 手写实现传统分类算法:决策树,并分析基于问题数据集特征的树生成与剪枝方法,应用于 cifar10 图片分类任务。

    • 深度学习:分析说明深度卷积神经网络模型的超参数,分析各个网络层作用,分析深度卷积神经网络模型的可解释性,可视化分析过程。

    • 深度学习:自主设计搭建合适的深度卷积神经网络,说明设计思路,也可优化改进已有的网络模型结构。

  • 实验 3 聚类实验

  • 基础内容

    自行选取一个数据集进行聚类。

  • 加分内容

    本次实验没有加分内容。

由于 2022 年春季学期正值上海疫情爆发,因此取消了期末考试,修改为期末报告进行期末考核。期末报告的要求如下(以下内容为老师发布的原文)。

  • 总结 3 次实验的心得体会。

  • 讨论作业遇到的问题,结合本课程的学习,提出可能改进的方案设想。

  • 实现方案中的一些设想,并讨论结果。

  • 自我评价(对于本课程学习的自我评价,想拿优的同学注意了,这里特别要说清楚自己在大作业及期末报告中所做的工作亮点)。

期末报告的字数不做限制。

3. 课堂

每次课程结束后老师会提一个问题来做考勤,提交方式为写在纸上上交。线上上课时提交方式为拍照发给助教。

授课安排如下。

  • 1-15 周

  • 线性模型

  • 决策树

  • 人工神经网络

  • 实验 1 回归实验的课堂展示

  • 深度学习

  • 贝叶斯学习

  • 集成学习

  • 实验 2 分类实验的课堂展示

  • 聚类

  • 降维

  • 强化学习

  • 实验 3 聚类实验的课堂展示

  • 16 周

  • 复习答疑

  • 17 周

  • 原定为考试,2022 年春季学期由于疫情取消考试,因此同样为复习答疑

二、任课教师

1. 10001 Li

老师脾气很好,同学们数次在课程群中匿名冲塔(主要针对部分小组课堂展示超时问题)也没有生气。