史上最全的机器学习面试题-机器学习爱好者必看

1.什么是机器学习

机器学习是为了应对系统程序设计,属于计算机科学类的学科,它能根据经验进行自动学习和提高。例如:一个由程序操纵的机器人,它能根据从传感器搜集到的数据,完成一系列的任务和工作。它能根据数据自动地学习应用程序。

2.机器学习与数据挖掘的区别

机器语言是指在没有明确的程序指令的情况下,给予计算机学习能力,使它能自主的学习、设计和扩展相关算法。数据挖掘则是一种从非结构化数据里面提取知识或者未知的、人们感兴趣的图片。在这个过程中应用了机器学习算法。

3.什么是机器学习的过度拟合现象

在机器学习中,当一个统计模型首先描述随机误差或噪声,而不是自身的基本关系时,过度拟合就会出现。当一个模型是过于复杂,过拟合通常容易被发现,因为相对于训练数据类型的数量,参数的数量过于五花八门。那么这个模型由于过度拟合而效果不佳。

4.过度拟合产生的原因

由于用于训练模型的标准并不等同于判断模型效率的标准,这导致了产生过度拟合的可能性。

5.如何避免过度拟合

当你使用较小的数据集进行机器学习时,容易产生过度拟合,因此使用较大的数据量能避免过度拟合现象。但是,当你不得不使用小型数据集进行建模时,可以使用被称为交叉验证的技术。在这种方法中数据集被分成两节,测试和训练数据集,测试数据集只测试模型,而在训练数据集中,数据点被用来建模。

在该技术中,一个模型通常是被给定有先验知识的数据集(训练数据集)进行训练,没有先验知识的数据集进行测试。交叉验证的思想是:在训练阶段,定义一个数据集用来测试模型。

6.什么是感应式的机器学习?

感应机器学习涉及由实践进行学习的过程,能从一组可观测到的例子的尝试推导出普遍性规则。

7.什么是机器学习的五个流行的算法?

1. 决策树2. 神经网络(反向传播)3. 概率网络4.最邻近法5. 支持向量机 8.机器学习有哪些不同的算法技术? 在机器学习不同类型的算法技术是:

1. 监督学习2.非监督学习3. 半监督学习4. 转导推理(Transduction)5.学习推理(Learning to Learn)。

9.在机器学习中,建立假设或者模型的三个阶段指的是什么? 1.建模2.模型测试3.模型应用。 10.什么是监督学习的标准方法?

监督学习的标准方法是将一组示例数据的分成训练数据集和测试数据集。 11.什么是训练数据集和测试数据集?

在类似于机器学习的各个信息科学相关领域中,一组数据被用来发现潜在的预测关系,称为“训练数据集”。训练数据集是提供给学习者的案例,而试验数据集是用于测试由学习者提出的假设关系的准确度。

12.下面列出机器学习的各种方法? 机器学习的各种方法如下“

1.概念与分类学习(Concept Vs Classification Learning)。 2.符号与统计学习(Symbolic Vs Statistical Learning)。 3.归纳与分析学习(Inductive Vs Analytical Learning)。 13.非机器学习有哪些类型? 人工智能、规则推理。 14.什么是非监督学习的功能?

1.求数据的集群2. 求出数据的低维表达3. 查找数据有趣的方向4. 有趣的坐标和相关性5.发现显著的观测值和数据集清理

15.什么是监督学习的功能?

1.分类、2.语音识别3.回归4.时间序列预测5. 注释字符串 16.什么是算法独立的机器学习?

机器学习在基础数学领域独立于任何特定分类器或者学习算法,被称为算法独立的机器学习。

17.人工智能与机器学习的区别?

基于经验数据的特性而设计和开发的算法被称为机器学习。而人工智能不但包括机器学习,还包括诸如知识表示,自然语言处理,规划,机器人技术等其它方法。

18.在机器学习中分类器指的是什么?

在机器学习中,分类器是指输入离散或连续特征值的向量,并输出单个离散值或者类型的系统。

19.朴素贝叶斯方法的优势是什么?

朴素贝叶斯分类器将会比判别模型,譬如逻辑回归收敛得更快,因此你只需要更少的训练数据。其主要缺点是它学习不了特征间的交互关系。

20.在哪些领域使用模式识别技术? 模式识别被应用在:

1. 计算机视觉2.语言识别3.统计4.数据挖掘5. 非正式检索6. 生物信息学。 21.什么是遗传编程?

遗传编程的机器学习中两种常用的方法之一。该模型是基于测试,并在一系列的结果当中,获取最佳选择。

22.在机器学习中归纳逻辑程序设计是指什么?

归纳逻辑程序设计(ILP)是利用逻辑程序设计表达的背景知识和实例,它是机器学习的一个分支。

23.在机器学习中,模型的选择是指?

在不同的数学模型中,选择用于描述相同的数据集的模型的过程被称为模型选择。模型选择吧被应用于统计,机器学习和数据挖掘的等相关领域。 24.用于监督学习校准两种方法是什么?

在监督学习中,用于预测良好概率的两种方法是: 1. 普拉特校准,2. 保序回归。

这些方法被设计为二元分类,而且有意义的。 25. 什么方法通常用于防止过拟合?

当有足够的数据进行等渗回归时,这通常被用来防止过拟合问题。 26.规则学习的启发式方法和决策树的启发式方法之间的区别是什么? 决策树的启发式方法评价的是一系列不相交的集合的平均质量;然而规则学习的启发式方法仅仅评价在候选规则覆盖下的实例集。

27.什么是感知机器学习?

在机器学习,感知器是一种输入到几个可能的非二进制输出的监督分类算法。 28.贝叶斯逻辑程序的两个组成部分是什么?

贝叶斯逻辑程序由两部分组成。第一成分由一组贝叶斯条款组成,能捕捉特定域的定性结构。第二组分是定量的,它能对域的量化信息进行编码。

29.什么是贝叶斯网络?

贝叶斯网络是用来表示一组变量之间为概率关系的图像模型。 30.为什么基于实例的学习算法有时也被称为懒惰学习算法?

基于实例的学习算法也被称为懒惰学习算法,因为它们延缓诱导或泛化过程,直到分类完成。

31.支持向量机能处理哪两种分类方法?

1.结合二分类法2. 修改二进制纳入多类学习法。 32.什么是集成学习?

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4