2线性模型

发表于2025-11-12|更新于2025-11-12|pytorch刘二大人

|浏览量:

深度学习顺序

准备数据集
模型选择
训练
推理
00:01:57.536

仅有输入的数据，在测试或者推理阶段

数据集交给算法，得到预测算法，使用模型只进行预测

知道输出值-》监督学习

测试集用于评价模型好坏

数据集分成两个部分
00:08:42.608

深度学习训练最大问题：过拟合
过拟合：把图像中的噪声也学进去了
比如训练集中的小猫都很可爱，但是测试集的小猫不可爱，导致测试中无法准确识别

需要模型有比较好的泛化能力

训练集分成两份
开发集用于对训练集进行评估，防止过拟合
评估比较好好再把所有的训练集重新训练，之后丢给测试集
00:15:00.775

其实就是找到 $f (x)$
线性模型是最基本的，可以最开始测试是否可用

预测出来的加上y heater
00:20:28.689

如何找到斜率为2

$\hat{y} (k) - y (k)$ 偏差值用于评估数据值与实际值之间的偏差

mean是平均loss

00:28:34.368

损失函数
平均平方误差（mse）

00:29:37.160

使用穷举法的思路
就是挨个w计算损失
00:30:41.118

在所有损失中选取最小的
00:32:32.288

前馈函数
00:32:11.320

数据集保存
输入输出要分开

相同的样本是一类，比如1和右边的0是一对
00:32:22.783

损失函数
00:33:04.537

两个列表用于存放权重和 权重对应的损失值

间隔为0.1
00:33:57.217

前馈
计算损失
损失值相加，没有均值
00:35:32.139

画图

这个表不很常用

因为上面这个图很难用来判断是否收敛
最常使用epoc（轮数）作为横坐标
00:37:18.063

00:37:29.365

上面是训练集的图像

下面红色的是开发集的数据00:37:55.434

这个点是收敛点

深度学习需要可视化，python绘图

常用visdom

np中的meshgrid()很重要

文章作者: Xing

文章链接: http://example.com/2025/11/12/pytorch%E5%88%98%E4%BA%8C%E5%A4%A7%E4%BA%BA/2%E7%BA%BF%E6%80%A7%E6%A8%A1%E5%9E%8B/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Xing！

编程调试学习资源神经网络深度学习 PyTorch 线性回归刘二大人数据集 Python

相关推荐

目标实现一个学习系统理解简单的神经网络（nn）/dl 00:11:46.636 人类智能通过信息进行推理看到照片与抽象概念结合：预测 00:19:29.936 mechine learning 就是代替人脑目前常用的都是监督学习算法思维：穷举贪心分治动态规划深度学习：有数据集找出算法机器学习计算过程也就是函数来源于数据，而不是人工（基于统计） 00:24:01.499 dl属于表示学习rl 00:28:28.199 求原函数首先构造知识库 00:29:14.598 00:29:41.156 实现类似人类智能的就算ai 00:32:34.716 对于复杂问题，基于规则的代码，人类难以维护经典机器学习：手工提取特征。最重要要把 00:34:05.608 重点是使用机器学习找到中间的 #mjx-3f243cf{ display:contents; mjx-assistive-mml { user-select: text !important; ...

6逻辑斯蒂回归

mnist数据集 00:01:43.327 手写数据的数据集 10个分类 00:02:24.593 判断y属于集合中的哪一个，这个叫做分类问题 00:06:02.081 表示他属于某一个类的概率，选择最大的 00:06:54.719 torchvison包含了一些典型的训练集 train=1-> train train=0 ->test 00:09:23.751 00:10:34.118 y的值维0 或1 这个叫做二分类问题 00:13:38.275 00:14:36.865 00:16:18.710 00:16:31.844 00:17:54.518 左图被称为饱和函数 00:18:19.386 00:19:19.394 将 #mjx-d4b5355{ display:contents; mjx-assistive-mml { user-select: text !important; clip: auto !important; ...

3梯度下降算法的实现

00:02:00.228 使用随机猜测寻找 #mjx-6674e5f{ display:contents; mjx-assistive-mml { user-select: text !important; clip: auto !important; color: rgba(0,0,0,0); } mjx-container[jax="SVG"] { direction: ltr; } mjx-container[jax="SVG"] > svg { overflow: visible; min-height: 1px; min-width: 1px; } mjx-container[jax="SVG"] > svg a { fill: blue; stroke: blue; } mjx-assistive-mml { position: absolute !important; ...

00:02:09.538 dataset用于将数据进行标记，标记label 00:02:52.896 dataloader为网络提供不同的数据形式 00:04:13.403 dateset需要考虑，主要实现以下功能如何获取每一个数据以及label 告诉我们总共有多少数据 00:05:51.702 00:05:48.542 数据集分为训练数据集和测试数据集第二种数据集00:07:12.051 这里面还有标注的label 或者直接把label直接标注在图片上配置终端代理前配置终端代理后，网速还是很感人 12set HTTP_PROXY=http://127.0.0.1:7890set HTTPS_PROXY=http://127.0.0.1:7890 nnd还是失败了一样的报错还是，加载超时 nnd网络抽风要测试您的代理配置是否成功，有几种方法可以查看您是否能够通过代理访问外部网络。以下是一些常用的测试方法：方法 1: 使用 curl 命令如果您的系统上安装了 curl，您可以在命令提示符中运行以下命令来测试代理连接： 1curl -I https...

9多分类问题

使用softmax 00:01:46.755 00:01:58.457 十个分类神经网络应该如何设计 00:03:21.365 希望的要求：输出之间竞争性输出就是一个分布概率大于0 概率求和为1 00:08:00.963 00:09:30.429 00:10:29.210 求和之后结果为100:12:58.619 00:13:42.719 00:14:09.852 00:14:49.264 00:14:59.977 交叉熵 00:18:14.365 00:19:17.457 00:19:36.942 00:20:50.262 00:21:47.606 00:22:31.144 最后一层是不需要手动进行非线性激活的，因为交叉熵损失会直接激活 00:24:38.539 00:24:21.657 2表示这个第二个元素最大 0表示第0个元素最大 1表示第一个元素最大 y_pred和预测的比较拟合，所以第一个预测算出来的损失会比较小 00:26:14.653 00:26:40.399 思考交叉熵和nll损失的区别 00:28:33.060...

11卷积神经网络（高级）

之前学习的都是线性的串行结构就是上一个的输出作为下个的输入 00:02:06.381 convoltion：卷积 pooling：池化 softmax：输出 other：拼接层为了减少代码冗余：使用函数调用构造类 00:04:05.180 发现这些快长得都一样所以把其封装成类 00:06:02.235 有一些参数比较难选比如kernel选哪个， googlenet的思路是，再一个块中，使用多个kernnel 然后对结果进行评价，让最优的kernel权重增加 00:09:21.370 对于每一条路，变换之后bwh必须相同 c可以不同 00:11:39.744 00:11:51.236 00:11:59.066 00:13:31.719 00:13:30.545 00:13:30.545 求和也就是信息融合 00:17:39.604 00:19:24.494 上面这个的运算量太大了 00:20:06.613 直接变为原来的十分之一这个也就是1x1的卷积神经网络的作用网络中的网络：1x1卷积 00:22:11.511 00:23:26.25...