10卷积神经网络（初级）

发表于2025-11-12|更新于2025-11-12|pytorch刘二大人

|浏览量:

二维卷积神经网络

放进卷积层，然后使通道数提升

下采样层中通道数是不变的
但是宽高会变

目的减少数据量，降低运算的需求
00:05:59.344

再做一次5x5的卷积
然后2x2的下采样

最后要把三阶向量展开成一维向量
就是挨个排序
00:07:13.014

然后利用全连接层来映射到10个输出

利用各种层，进行维度变换

卷积+下采样=特征提取器

图像：
rgb图像
栅格图像
00:11:25.291

00:25:19.212

取出来一个图形块
对图像块进行卷积
依次移动

输出通道数
00:28:20.851

00:29:22.737

这个就是单通道卷积的形象表示

三通道卷积
00:31:02.697

每一个通道设置一个卷积核
00:32:17.903

最后三维变成1维
00:33:10.285

由于kernel
是3x3的所以 h和w减二

n个通道，就需要n个卷积核
00:39:22.814

00:39:58.292

00:40:29.340

00:40:45.478

输入输出通道，
所有输入的数据都应是小批量的
生成随机输入数据
conv_layer卷积层
输入通道数量
输出通道数量
kernel大小

把创建的对象输入到卷积层中

输入5各通道 100X100长宽
输出10个通道 10 ，98，98

10是输出通道数5输入通道，3，3是卷积核大小

如果我们想要获得5X5的图像，而不是卷积过后3x3的

我们可以在input外围添加一圈
00:46:00.422

7x7 * 5x5 -> 5x5

最常见的就是填充0

这里的B是batch——size

构建一个卷积层
前两个变量，一个是输入通道，一个是输出通道数
pading 就是上图填0

构建卷积核
00:48:57.849

输出、输入、宽度、高度

这里对卷积层进行了初始化

如果要输出2x2的
这里就要求stride这个参数为2，也就是步长为2，一次移动两格（长宽都一样
00:49:51.532

00:50:04.802

这个可以有效降低输出的宽高
00:50:33.270

代码变动在这里

下采样

最大池化层

分成2x2的区间，然后再这个各格子内，找最大值

与通道无关，所以变换过后，通道数不变
00:51:51.468

笨比了

5x5的kernel会导致图像长宽变小4
这个可以自己画个图理解一下

00:53:18.662

进行一个最大池化
00:53:41.142

输入通道和输出通道00:54:00.492

320个元素进行向量化，经过全连接层，映射成10
00:56:19.190

下面将全连接的网络改成卷积神经网络
00:56:46.689

00:57:02.712

relu是进行激活
00:57:43.856

00:58:42.200

右边代码和左图有点不一样
右边代码是是
做完卷积之后先做的池化，然后做的激活
00:59:43.641

view目的就是让其映射到全连接网络所需要的输入
fc就是使用全连接层进行变换

由于要进行交叉熵损失计算，所以最后一层不需要进行激活

文章作者: Xing

文章链接: http://example.com/2025/11/12/pytorch%E5%88%98%E4%BA%8C%E5%A4%A7%E4%BA%BA/10%E5%8D%B7%E7%A7%AF%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C%EF%BC%88%E5%88%9D%E7%BA%A7%EF%BC%89/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Xing！

神经网络卷积神经网络计算机网络深度学习 PyTorch 刘二大人机器学习 CNN 网络

相关推荐

11卷积神经网络（高级）

之前学习的都是线性的串行结构就是上一个的输出作为下个的输入 00:02:06.381 convoltion：卷积 pooling：池化 softmax：输出 other：拼接层为了减少代码冗余：使用函数调用构造类 00:04:05.180 发现这些快长得都一样所以把其封装成类 00:06:02.235 有一些参数比较难选比如kernel选哪个， googlenet的思路是，再一个块中，使用多个kernnel 然后对结果进行评价，让最优的kernel权重增加 00:09:21.370 对于每一条路，变换之后bwh必须相同 c可以不同 00:11:39.744 00:11:51.236 00:11:59.066 00:13:31.719 00:13:30.545 00:13:30.545 求和也就是信息融合 00:17:39.604 00:19:24.494 上面这个的运算量太大了 00:20:06.613 直接变为原来的十分之一这个也就是1x1的卷积神经网络的作用网络中的网络：1x1卷积 00:22:11.511 00:23:26.25...

目标实现一个学习系统理解简单的神经网络（nn）/dl 00:11:46.636 人类智能通过信息进行推理看到照片与抽象概念结合：预测 00:19:29.936 mechine learning 就是代替人脑目前常用的都是监督学习算法思维：穷举贪心分治动态规划深度学习：有数据集找出算法机器学习计算过程也就是函数来源于数据，而不是人工（基于统计） 00:24:01.499 dl属于表示学习rl 00:28:28.199 求原函数首先构造知识库 00:29:14.598 00:29:41.156 实现类似人类智能的就算ai 00:32:34.716 对于复杂问题，基于规则的代码，人类难以维护经典机器学习：手工提取特征。最重要要把 00:34:05.608 重点是使用机器学习找到中间的 #mjx-3f243cf{ display:contents; mjx-assistive-mml { user-select: text !important; ...

4back propagation(反向传播）

00:01:49.339 00:02:18.624 注意这里时对损失进行求导，而不是对 #mjx-5a3a948{ display:contents; mjx-assistive-mml { user-select: text !important; clip: auto !important; color: rgba(0,0,0,0); } mjx-container[jax="SVG"] { direction: ltr; } mjx-container[jax="SVG"] > svg { overflow: visible; min-height: 1px; min-width: 1px; } mjx-container[jax="SVG"] > svg a { fill: blue; stroke: blue; } mjx-assistive-mml { position:...

深度学习顺序准备数据集模型选择训练推理 00:01:57.536 00:02:38.739 00:03:56.345 仅有输入的数据，在测试或者推理阶段 00:04:40.157 数据集交给算法，得到预测算法，使用模型只进行预测 00:05:46.753 知道输出值-》监督学习测试集用于评价模型好坏数据集分成两个部分 00:08:42.608 00:10:06.592 00:12:21.957 00:13:54.806 深度学习训练最大问题：过拟合过拟合：把图像中的噪声也学进去了比如训练集中的小猫都很可爱，但是测试集的小猫不可爱，导致测试中无法准确识别需要模型有比较好的泛化能力训练集分成两份开发集用于对训练集进行评估，防止过拟合评估比较好好再把所有的训练集重新训练，之后丢给测试集 00:15:00.775 00:17:13.524 其实就是找到 #mjx-5672fa7{ display:contents; mjx-assistive-mml { ...

6逻辑斯蒂回归

mnist数据集 00:01:43.327 手写数据的数据集 10个分类 00:02:24.593 判断y属于集合中的哪一个，这个叫做分类问题 00:06:02.081 表示他属于某一个类的概率，选择最大的 00:06:54.719 torchvison包含了一些典型的训练集 train=1-> train train=0 ->test 00:09:23.751 00:10:34.118 y的值维0 或1 这个叫做二分类问题 00:13:38.275 00:14:36.865 00:16:18.710 00:16:31.844 00:17:54.518 左图被称为饱和函数 00:18:19.386 00:19:19.394 将 #mjx-d4b5355{ display:contents; mjx-assistive-mml { user-select: text !important; clip: auto !important; ...

7处理多维输入

输入有多个特征每一行被叫做一个样本 00:01:22.739 meiyili 每一列被称为特征 excel常用空格 tab ，进行分割 00:10:22.816 00:10:06.374 00:12:37.613 00:13:38.352 00:14:24.317 一组一组的运算转换成矩阵运算（向量化的运算）为什么要变换：因为可以并行计算，这个样利用cpu或者gpu的并行计算能力 00:15:14.284 上图是上节课的可以用于与这节课的图片进行对比把多层logist回归相连就可以构建多层神将网路 00:17:12.583 00:17:28.402 这里列的数量对应特征00:17:50.766 00:18:23.748 这样可以再接一层，让2维的再降到1维 00:20:31.314 00:21:21.153 我们的目标是8d->1d的非线性变换函数 #mjx-b62d9cf{ display:contents; mjx-assistive-mml { ...