文章图片
文章图片
文章图片
文章图片
文章图片
文章图片
总结了常用的图像特征工程 , 裁剪 , 灰度化 , RGB通道选择 , 强度阈值 , 边缘检测和颜色过滤器
一提到特征工程 , 我们立即想到是表格数据 。 但是我们也可以得到图像数据的特征 , 提取图像中最重要的方面 。 这样做可以更容易地找到数据和目标变量之间的映射 。
这样可以使用更少的数据和训练更小的模型 。 更小的模型可以减少预测所需的时间 。 这在部署到边缘设备时特别有用 。 另一个好处是 , 可以更确定模型使用什么来进行这些预测 。
本文将介绍使用Python进行图像特征工程的一些方法:
- Cropping
- Grayscalling
- Selecting RGB channels
- Intensity thresholds
- Edge detection
- Colour filters (给定的颜色范围内提取像素)
特性工程与增强在深入研究之前 , 有必要讨论一下图像增强 。 该方法的目标与特征工程相似 。 但是它以不同的方式实现 。
什么是数据增强?
数据增强是指我们使用代码系统地或随机地改变数据 。 对于图像 , 这包括翻转、调整颜色和添加随机噪声等方法 。 这些方法允许我们人为地引入噪声并增加数据集的大小 。
在生产中 , 模型需要在不同的条件下执行 。 这些条件是由照明、相机的角度、房间的颜色或背景中的物体等变量决定的 。
数据增强的目标是创建一个对这些条件的变化具有鲁棒性的模型 。 它通过添加模拟现实世界条件的噪声来实现这一点 。 例如 , 改变图像的亮度类似于在一天的不同时间收集数据 。
通过增加数据集的大小 , 增强还允许我们训练更复杂的架构 。 或者说它有助于模型参数收敛 。
图像数据特征工程
【删除|图像数据的特征工程】特征工程的目标是与增强是相似的 , 也就是想要创建一个更健壮的模型 。 但是不同的是 , 它删除了任何对准确预测没有必要的噪音 。 也就是去掉了在不同条件下会发生变化的变量(这正好与增强相反) 。
通过提取图像中最重要的部分简化了问题 。 这允许使用更简单的模型架构 。 我们可以使用更小的数据集来找到输入和目标之间的映射 。
另外一个重要的区别是如何在生产中处理这些方法 。 你的模型不会对增强图像做出预测 。 但是使用特征工程 , 模型将需要在它训练的相同特征上做出预测 。 这意味着必须能够在生产环境中进行相同的特性工程 。
使用Python进行图像特征工程下面我们开始进入正题 , 让我们开始进行特性工程的操作 。
- 数据库|心脏不好的用户不可错过 dido E10S PRO智能手表
- 印度|想要做AI训练师人才孵化,数据标注员可以吗?
- 说到快充充电器|使用快充可以使用普通数据线吗?
- 说到手机存储|miui12其它文件占用十几gb,要不要全部删除?
- 微软|超越微软,海底数据中心行业崛起了吗?
- 微信作为一种社交和工作的APP|微信能否找回删除的好友?
- 说到快充充电器|65w快充需要几a数据线?
- 你总是选不对应该使用的数据库?这里5步教你解决这些忧愁
- 学完SQL数据库,不知道走哪方面?这里给你介绍十个高薪工作
- 数据壁垒全打通!华为云数字化诊断推动贵州长通集团华丽转身