删除|图像数据的特征工程

删除|图像数据的特征工程

文章图片

删除|图像数据的特征工程

文章图片

删除|图像数据的特征工程

文章图片

删除|图像数据的特征工程

文章图片

删除|图像数据的特征工程

文章图片

删除|图像数据的特征工程

文章图片

删除|图像数据的特征工程

总结了常用的图像特征工程 , 裁剪 , 灰度化 , RGB通道选择 , 强度阈值 , 边缘检测和颜色过滤器
一提到特征工程 , 我们立即想到是表格数据 。 但是我们也可以得到图像数据的特征 , 提取图像中最重要的方面 。 这样做可以更容易地找到数据和目标变量之间的映射 。
这样可以使用更少的数据和训练更小的模型 。 更小的模型可以减少预测所需的时间 。 这在部署到边缘设备时特别有用 。 另一个好处是 , 可以更确定模型使用什么来进行这些预测 。

本文将介绍使用Python进行图像特征工程的一些方法:

  • Cropping
  • Grayscalling
  • Selecting RGB channels
  • Intensity thresholds
  • Edge detection
  • Colour filters (给定的颜色范围内提取像素)
我们将在自动驾驶汽车上进行演示 。 如下图所示 , 轨道的图像训练一个模型 。 然后该模型将被用来做出预测 , 指导汽车行驶 。 本文的最后我们将讨论图像数据特征工程的局限性 。

特性工程与增强在深入研究之前 , 有必要讨论一下图像增强 。 该方法的目标与特征工程相似 。 但是它以不同的方式实现 。
什么是数据增强?
数据增强是指我们使用代码系统地或随机地改变数据 。 对于图像 , 这包括翻转、调整颜色和添加随机噪声等方法 。 这些方法允许我们人为地引入噪声并增加数据集的大小 。
在生产中 , 模型需要在不同的条件下执行 。 这些条件是由照明、相机的角度、房间的颜色或背景中的物体等变量决定的 。
数据增强的目标是创建一个对这些条件的变化具有鲁棒性的模型 。 它通过添加模拟现实世界条件的噪声来实现这一点 。 例如 , 改变图像的亮度类似于在一天的不同时间收集数据 。
通过增加数据集的大小 , 增强还允许我们训练更复杂的架构 。 或者说它有助于模型参数收敛 。
图像数据特征工程
【删除|图像数据的特征工程】特征工程的目标是与增强是相似的 , 也就是想要创建一个更健壮的模型 。 但是不同的是 , 它删除了任何对准确预测没有必要的噪音 。 也就是去掉了在不同条件下会发生变化的变量(这正好与增强相反) 。
通过提取图像中最重要的部分简化了问题 。 这允许使用更简单的模型架构 。 我们可以使用更小的数据集来找到输入和目标之间的映射 。
另外一个重要的区别是如何在生产中处理这些方法 。 你的模型不会对增强图像做出预测 。 但是使用特征工程 , 模型将需要在它训练的相同特征上做出预测 。 这意味着必须能够在生产环境中进行相同的特性工程 。
使用Python进行图像特征工程下面我们开始进入正题 , 让我们开始进行特性工程的操作 。