Skip to content

Latest commit

 

History

History
103 lines (52 loc) · 7.33 KB

are-we-undervaluing-simple-models.md

File metadata and controls

103 lines (52 loc) · 7.33 KB

我们是否低估了简单模型?

原文:www.kdnuggets.com/are-we-undervaluing-simple-models

我们是否低估了简单模型?

由 DALL-E 2 生成的图像

当前机器学习领域的趋势都是关于高级模型的。这种趋势主要由许多课程推荐的复杂模型推动,使用像深度学习或大型语言模型这样的模型看起来要更令人惊叹。商业人士也没有改变这种观念,他们只是看到流行的趋势。


我们的前三个课程推荐

1. Google 网络安全证书 - 快速进入网络安全职业生涯

2. Google 数据分析专业证书 - 提升你的数据分析技能

3. Google IT 支持专业证书 - 支持你组织的 IT 工作


简单性并不意味着结果平淡。一个简单的模型仅意味着它用来提供解决方案的步骤比高级模型更简单。它可能使用更少的参数或更简单的优化方法,但简单模型仍然是有效的。

参考哲学原理,奥卡姆剃刀或简约法则指出,最简单的解释通常是最好的。这意味着大多数问题通常可以通过最直接的方法解决。这就是为什么简单模型的价值在于它简单的本质来解决问题。

一个简单的模型和任何类型的模型一样重要。这是文章要传达的关键信息,我们将探讨原因。那么,让我们开始吧。

简单模型及其优势

当我们谈论简单模型时,什么构成一个简单模型?逻辑回归或朴素贝叶斯通常被称为简单模型,而神经网络则是复杂的;那么随机森林呢?它是简单模型还是复杂模型?

通常,我们不会将随机森林归类为简单模型,但也常常犹豫是否将其归为复杂模型。这是因为没有严格的规则来规范模型的简单级别分类。然而,有一些方面可能有助于分类模型。它们是:

  • 参数数量,

  • 可解释性,

  • 计算效率。

这些方面也会影响模型的优势。让我们详细讨论一下。

参数数量

参数是模型固有的配置,在训练过程中学习或估计得到。不同于超参数的概念,参数不能由用户初始设置,而是受超参数选择的影响。

参数的示例包括线性回归系数、神经网络的权重和偏置以及 K-means 聚类中心。正如你所见,模型参数的值在学习数据时会独立变化。参数值在模型迭代中不断更新,直到最终模型呈现。

线性回归是一个简单的模型,因为它的参数较少。线性回归的参数是它的系数和截距。根据我们训练的特征数量,线性回归将有n+1个参数(n 是特征系数的数量,加上 1 作为截距)。

与神经网络相比,这个模型的计算更加复杂。神经网络中的参数包括权重和偏置。权重取决于层输入(n)和神经元(p),权重参数的数量为 np。每个神经元都有自己的偏置,因此每个p都有一个p的偏置。总的来说,参数数量大约为**(np) + p**。复杂性随着每个额外层的增加而增加,每增加一层就会增加**(n*p) + p**个参数。

我们已经看到参数的数量影响模型复杂性,但它如何影响整体模型输出性能?最关键的概念是它影响过拟合风险。

过拟合发生在我们的模型算法具有较差的泛化能力时,因为它学习了数据集中的噪声。参数更多的模型能够捕捉数据中的更复杂模式,但它也包括噪声,因为模型认为这些噪声是重要的。相反,参数较少的模型具有有限的能力,这意味着更难以过拟合。

解释性和计算效率也会直接受到影响,我们将进一步讨论。

解释性

解释性是一个机器学习概念,指的是机器学习解释输出的能力。基本上,它是用户如何理解模型行为的输出。简单模型的重要价值在于它们的解释性,这直接来源于较少的参数数量。

拥有更少的参数,简单模型的解释性会更高,因为模型更容易解释。此外,模型的内部工作原理更加透明,因为理解每个参数的角色比复杂模型更容易。

例如,线性回归系数更容易解释,因为系数参数直接影响特征。相比之下,像神经网络这样的复杂模型难以解释参数对预测输出的直接贡献。

可解释性在许多业务领域或项目中价值巨大,因为特定业务需要输出能够被解释。例如,医疗领域的预测需要可解释性,因为医学专家需要对结果充满信心;毕竟,它影响着个人生活。

避免模型决策中的偏见也是许多人偏好使用简单模型的原因。假设一家贷款公司用一个充满偏见的数据集训练模型,而输出反映了这些偏见。我们希望消除这些偏见,因为它们是不道德的,因此可解释性对于检测这些偏见至关重要。

计算效率

参数减少的另一个直接效果是计算效率的提高。参数较少意味着找到参数所需的时间更少,计算能力需求也较低。

在生产环境中,计算效率更高的模型将更易于部署,并在应用中具有更短的推理时间。这种效果也会导致简单模型更容易在资源有限的设备上部署,例如智能手机。

总体而言,简单模型会使用更少的资源,从而减少处理和部署上的支出。

结论

我们可能会低估一个简单模型,因为它看起来不够花哨,或者没有提供最优的指标输出。然而,我们可以从简单模型中获得很多价值。通过查看定义模型简单性的方面,简单模型带来了这些价值:

  • 简单模型拥有较少的参数,但也降低了过拟合的风险,

  • 凭借更少的参数,简单模型提供了更高的可解释性价值,

  • 此外,更少的参数意味着简单模型在计算上更为高效。

Cornellius Yudha Wijaya**** 是一名数据科学助理经理和数据撰稿人。在全职工作于 Allianz Indonesia 的同时,他喜欢通过社交媒体和写作媒体分享 Python 和数据技巧。Cornellius 撰写了各种人工智能和机器学习主题的文章。

相关主题