中国科学院大学
试 题 专 用 纸
课程编号:E32004H
课程名称:机器学习方法与应用 任课教师:叶齐祥
———————————————————————————————————————————————
姓名 学号 成绩 说明:本试卷共两页,满分100分,其中概念题45分,应用题55分。考试时间为100分钟,请将试题的答案都写在答题纸上。
一、 概念解释与简述题(45 分) 1. 样本(样例)、机器学习、统计学习 2. 机器学习的一般步骤(请画示意图) 3. 样本属性的主要类型 4.信息增益
5.核函数SVM的判别方程 6. Adaboost的判别函数
7.二维数据三个混合项的高斯模型的概率密度方程 8.聚类分析有哪些主要距离度量方法?请列举3-4种 9.列举K-means聚类方法与GMMs方法的共同点 二、 计算与分析题(共55 分)
表1- 是否去打球训的练样本,天气、湿度、温度、风为属性
编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 天气 晴天 晴天 阴天 下雨 下雨 下雨 阴天 晴天 晴天 下雨 晴天 阴天 阴天 下雨 温度 炎热 炎热 炎热 适中 寒冷 寒冷 寒冷 适中 寒冷 适中 适中 适中 炎热 适中 湿度 高 高 高 高 正常 正常 正常 高 正常 正常 正常 高 正常 高 风 弱 强 弱 弱 弱 强 强 弱 弱 弱 强 强 弱 强 是否去打球(标号) 不去 不去 不去 去 去 不去 去 不去 去 去 去 去 去 不去
中国科学院大学—机器学习方法与应用 考试试题 A卷 1. 决策树属性选择 :对于表-1中的数据,“湿度”、“风”两个 分别将数据划分如下:
S: (9+, 5-) 湿度 高 正常
S: (9+, 5-) 风 弱 (5+, 3-)
强
(2+, 5-) (6+, 1-)
(3+, 3-)
其中”9+”表示9个正例(去打球)、“5-”表示5个反例(不去打球),其他依此类推。请基于“信息增益”的方法判断哪个属性更好?
2. 贝叶斯方法:对于表-1中的数据,给一个新实例<天气(阴天), 温度(寒冷), 湿度(高), 风(强),
请基于朴素贝叶斯方法决策是否去打球?
3. SVM :请从分类间距最大化的角度,基于二次规划(无需求解过程)推导线性SVM的判别方程。
4. 深度神经网:简述LeNet5卷积神经网的结构、权值求解方法,着重阐明卷积神经网络权值、连接的物理含
义。并结合传统神经网络的BP算法,简要推导卷积神经网络的误差传播过程。
5. 数据降维:PCA与Manifold 数据降维的不同点在哪里?
6. 其他:请谈谈你将来的科研中可能使用那些机器学习方法,并简要说明选择此种方法的原因。
共 2 页 第2 页