如何找到最适合你的神经网络来进行预测建模?
对深度学习领域的初学者来说,选择合适的网络是非常苦恼的事,因为有太多类型的网络可供选择,并且每天都有新方法发布和讨论。
更糟糕的是,大多数神经网络都足够灵活,即使在使用错误类型的数据或预测问题时也能做出预测。
通过这篇文章,你将发现人工神经网络的三个主要类别的实用建议和用途。
看完这篇文章,你将知道:
- 在处理预测建模问题时应关注哪些类型的神经网络。
- 何时使用、不使用以及可能尝试在项目中使用 MLP、CNN 和 RNN。
- 在选择模型之前考虑使用混合模型并清楚地了解你的项目目标。
概述
这篇文章分为五个部分
- 关注哪些神经网络?
- 何时使用多层感知器?
- 何时使用卷积神经网络?
- 何时使用递归神经网络?
- 混合网络模型
关注哪些神经网络?
深度学习是使用现代硬件的人工神经网络的应用,它可以开发、训练和使用比以前认为可能的更大(更多层)的神经网络。
研究人员提出了数千种特定的神经网络,作为对现有模型的修改或调整。
一般而言,我们只需要关注三类人工神经网络。它们是:
- 多层感知器 (MLP)
- 卷积神经网络 (CNN)
- 循环神经网络 (RNN)
这三类网络提供了很大的灵活性,并且在过去的几十年中证明了它们在解决各种问题时是有用和可靠的。它们还有许多子类型,用来帮助它们专门针对不同预测问题框架和不同数据集的问题。
现在我们知道了要关注哪些网络,再让我们看看什么时候可以使用每一类神经网络。
何时使用多层感知器?
多层感知器,简称 MLP,是神经网络的经典类型。
它们由一层或多层神经元组成。数据被馈送到输入层,可能有一个或多个隐藏层提供抽象级别,并在输出层(也称为可见层)上进行预测。
MLP 适用于为输入分配类别或标签的分类预测问题。
它们也适用于回归预测问题,其中在给定一组输入的情况下预测实数值。数据通常以表格格式提供,例如你在 CSV 文件或电子表格中看到的格式。
将 MLP 用于:
- 表格数据集
- 分类预测问题
- 回归预测问题
它们非常灵活,通常可用于学习从输入到输出的映射。
这种灵活性允许它们应用于其他类型的数据。例如,图像的像素可以减少到一长行数据并输入 MLP。文档中的单词也可以减少为一长行数据并提供给 MLP。即使是时间序列预测问题的滞后观察也可以减少为一长行数据并提供给 MLP。
因此,如果你的数据采用表格数据集以外的形式,例如图像、文档或时间序列,我建议至少针对您的问题测试 MLP。结果可以用作比较的基线点,以确认可能看起来更适合的其他模型增加了价值。
尝试 MLP:
- 图像数据
- 文本数据
- 时间序列数据
- 其他类型的数据
何时使用卷积神经网络?
卷积神经网络或 CNN 旨在将图像数据映射到输出变量。
它们已被证明非常有效,以至于它们是涉及图像数据作为输入的任何类型预测问题的首选方法。
使用 CNN 的好处是它们能够开发二维图像的内部表示。这允许模型学习数据中不同结构的位置和比例,这在处理图像时很重要。
将 CNN 用于:
- 图像数据
- 分类预测问题
- 回归预测问题
简单来说,CNN 可以很好地处理具有空间关系的数据。
CNN 输入传统上是二维的,一个场或矩阵,但也可以更改为一维的,允许它开发一维序列的内部表示。
这使得 CNN 可以更广泛地用于具有空间关系的其他类型的数据。例如,文本文档中的单词之间存在顺序关系。时间序列的时间步长之间存在有序关系。
尽管不是专门为非图像数据开发的,但 CNN 在诸如用于情感分析的文档分类和相关问题等问题上取得了最先进的结果。
尝试使用 CNN:
- 文本数据
- 时间序列数据
- 顺序输入数据
何时使用递归神经网络?
递归神经网络或 RNN 旨在处理序列预测问题。
序列预测问题有多种形式,最好用支持的输入和输出类型来描述。
序列预测问题的一些示例包括:
- 一对多:观察作为输入映射到具有多个步骤的序列作为输出。
- 多对一:一系列多个步骤作为输入映射到类别或数量预测。
- 多对多:作为输入的多步序列映射到多步输出的序列。
多对多问题通常被称为序列到序列,简称seq2seq。
循环神经网络传统上很难训练。
长短期记忆网络或 LSTM 网络可能是最成功的 RNN,因为它克服了训练循环网络的问题,进而被用于广泛的应用。
一般的 RNN,尤其是 LSTM,在处理单词和段落序列(通常称为自然语言处理)时取得了最大的成功。
这包括以时间序列表示的文本序列和口语序列。它们还用作需要序列输出的生成模型,不仅用于文本,还用于生成手写等应用程序。
将 RNN 用于:
- 文本数据
- 语音数据
- 分类预测问题
- 回归预测问题
- 生成模型
循环神经网络不适用于您在 CSV 文件或电子表格中看到的表格数据集。它们也不适合图像数据输入。
不要将 RNN 用于:
- 表格数据
- 图像数据
RNN 和 LSTM 已经在时间序列预测问题上进行了测试,但至少可以说结果很差。自回归方法,甚至线性方法通常表现得更好。LSTM 的性能通常优于应用于相同数据的简单 MLP。
尽管如此,它仍然是一个活跃的领域。
也许在以下方面尝试 RNN:
- 时间序列数据
混合网络模型
很少单独使用 CNN 或 RNN 模型。
这些类型的网络用作更广泛模型中的层,该模型也具有一个或多个 MLP 层。从技术上讲,这些是混合类型的神经网络架构。
也许最有趣的工作来自将不同类型的网络混合在一起形成混合模型。
例如,考虑一个使用堆叠层的模型,其中输入是 CNN,中间是 LSTM,输出是 MLP。像这样的模型可以读取一系列图像输入(例如视频)并生成预测。这称为CNN LSTM 架构。
网络类型也可以堆叠在特定的架构中以解锁新功能,例如使用非常深的 CNN 和 MLP 网络的可重用图像识别模型,可以添加到新的 LSTM 模型并用于为照片添加字幕。此外,编码器-解码器 LSTM 网络可用于具有不同长度的输入和输出序列。
重要的是首先要清楚地考虑您和您的利益相关者对项目的需求,然后寻找满足您特定项目需求的网络架构(或开发一个)。
概括
在这篇文章中,你知道了人工神经网络的三个主要类型的建议和用途。
具体来说,你将了解到:
- 在处理预测建模问题时应关注哪些类型的神经网络。
- 何时使用、不使用以及可能尝试在项目中使用 MLP、CNN 和 RNN。
- 在选择模型之前考虑使用混合模型并清楚地了解你的项目目标。
- 分享
- 举报
-
浏览量:537次2023-10-07 17:46:34
-
浏览量:1403次2022-12-07 09:13:23
-
浏览量:2097次2022-03-16 09:00:15
-
浏览量:3942次2018-02-14 10:30:11
-
浏览量:5257次2021-08-13 15:39:02
-
浏览量:7011次2021-07-26 11:30:25
-
浏览量:6136次2021-07-26 11:27:40
-
浏览量:8371次2021-05-28 16:59:43
-
浏览量:5418次2021-05-28 16:59:25
-
浏览量:614次2023-09-04 11:16:00
-
浏览量:496次2023-07-18 13:41:23
-
浏览量:768次2023-07-05 10:11:45
-
浏览量:504次2023-07-05 10:11:51
-
浏览量:553次2023-09-02 09:45:20
-
浏览量:2943次2020-09-27 14:49:34
-
浏览量:1235次2022-12-06 19:29:47
-
浏览量:5031次2021-04-15 15:51:43
-
浏览量:669次2023-09-06 11:12:55
-
浏览量:8812次2021-05-13 12:53:50
-
广告/SPAM
-
恶意灌水
-
违规内容
-
文不对题
-
重复发帖
outman
感谢您的打赏,如若您也想被打赏,可前往 发表专栏 哦~
举报类型
- 内容涉黄/赌/毒
- 内容侵权/抄袭
- 政治相关
- 涉嫌广告
- 侮辱谩骂
- 其他
详细说明