机器学习|机器学习中的参数与非参数方法
讨论机器学习中参数和非参数方法的区别
介绍在我们的以前文章中介绍过统计学习中预测和推理之间的区别 。 尽管这两种方法的主要区别在于最终目标 , 但我们都需要估计一个未知函数f 。
换句话说 , 我们需要学习一个将输入(即自变量X的集合)映射到输出(即目标变量Y)的函数 , 如下图所示 。
Y = f(X) + ε
为了估计未知函数 , 我们需要在数据上拟合一个模型 。 我们试图估计的函数的形式通常是未知的 , 因此我们可能不得不应用不同的模型来得到它 , 或者对函数f的形式做出一些假设 。 一般来说 , 这个过程可以是参数化的 , 也可以是非参数化的 。
在今天的文章中 , 我们将讨论机器学习背景下的参数和非参数方法 。 此外 , 我们将探讨它们的主要差异以及它们的主要优点和缺点 。
参数化方法在参数化方法中 , 我们通常对函数f的形式做一个假设 。 例如 , 你可以假设未知函数f是线性的 。 换句话说 , 我们假设函数是这样的 。
【机器学习|机器学习中的参数与非参数方法】f(X) = β? + β? X? + … + β? X?
其中f(X)为待估计的未知函数 , β为待学习的系数 , p为自变量个数 , X为相应的输入 。
既然我们已经对要估计的函数的形式做出了假设 , 并选择了符合这个假设的模型 , 那么我们需要一个学习过程 , 这个学习过程最终将帮助我们训练模型并估计系数 。
机器学习中的参数化方法通常采用基于模型的方法 , 我们对要估计的函数的形式做出假设 , 然后根据这个假设选择合适的模型来估计参数集 。
参数化方法最大的缺点是 , 我们所做的假设可能并不总是正确的 。 例如 , 你可以假设函数的形式是线性的 , 但实际上它并不是 。 因此这些方法涉及较不灵活的算法 , 通常用于解决一些不复杂的问题 。
参数化方法速度非常快 , 而且它们需要的数据也少得多(更多相关内容将在下一节中介绍) 。 此外 , 由于参数化方法虽然不太灵活但是因为基于我们做出的假设 , 所以它们更容易解释 。
机器学习中的参数化方法包括线性判别分析、朴素贝叶斯和感知器 。
非参数方法一般来说非参数方法指的是对于要估计的函数的形式不做任何潜在的假设的一组算法 。 由于没有做任何假设 , 这种方法可以估计未知函数f的任何形式 。
非参数方法往往更精确 , 因为它们寻求最佳拟合数据点 。 但是这是以需要进行大量的观测为代价的(这些观测是精确估计未知函数f所必需的) 。 并且这些方法在训练模型时往往效率较低 。 另外的一个问题是 , 非参数方法有时可能会引入过拟合 , 因为由于这些算法更灵活 , 它们有时可能会以无法很好地泛化到新的、看不见的数据点的方式学习错误和噪声 。
非参数方法非常灵活 , 因为没有对底层函数做出任何假设 , 所以可以带来更好的模型性能 。
机器学习中一些非参数方法的例子包括支持向量机和kNN 。
总结在今天的文章中 , 我们讨论了机器学习背景下的参数化和非参数化方法以及它们的优点和缺点 。
参数方法往往不太灵活和准确 , 但更具可解释性 , 而非参数方法往往更灵活(因此适用于更复杂的问题)和准确但可解释性较差 。
尽管参数方法不太灵活并且有时不太准确 , 但它们在许多用例中仍然有用 , 因为在更简单的问题中使用非常灵活的非参数方法可能会导致过度拟合 。
作者:Giorgos Myrianthous
- DeepMind首席科学家:比起机器智能,我更担心人类智能造成的灾难
- 将理论注入深度学习,对过渡金属表面进行可解释的化学反应性预测
- 白白胖胖头顶起雾走走停停安全无误在哈尔滨站候车厅内一边消毒一边在室内移动的智能消毒机器人...|火车站里的机器人服务,是什么体验?
- 机器人|售价10万的日本“妻子”机器人,除了生娃啥都能做?太天真了
- “大筛”中的别样“红”:志愿者暖心陪你度寒冬
- 人类的工作会被AI取代吗?如果机器能够深度学习|为什么说AI能作巴赫的曲,却写不出村上春树的小说?
- 王中林|华为全球专利榜第四;京东海外开设机器人零售实体店;Oculus遭反垄断调查|科技周报
- 噪音|聊聊社交产品中的信号与暗示
- 大数据|人工智能步入千家万户,智能机器人的前景怎么样?
- 机器人|中国机器人“独角兽”,抢下国内90%份额,优势还在持续扩大!