PyTorch MNIST全连接分类器完整流程

寅斫 · 2025-12-24 19:10:00

PyTorch MNIST全连接分类器完整流程

1. 项目概述

1.1 项目背景与目标

深度学习是机器学习的一个分支，通过模拟人脑神经元网络结构，让计算机从数据中自动学习特征和规律。PyTorch是一个流行的深度学习框架，以其动态计算图、易用性和强大的GPU加速能力而闻名。
本项目的目标是使用PyTorch实现一个全连接神经网络，用于对MNIST手写数字数据集进行分类。MNIST数据集包含60,000张训练图像和10,000张测试图像，每张图像是28x28像素的手写数字（0-9）。
1.2 学习目标

通过这个项目，你将全面掌握PyTorch的完整工作流程，包括：

数据处理：加载、预处理和批量加载数据
模型设计：定义和初始化神经网络
训练策略：选择损失函数和优化器
训练与评估：实现训练循环和测试流程
模型管理：保存和加载训练好的模型

1.3 为什么选择这个项目？

经典数据集：MNIST是深度学习入门的经典数据集，复杂度适中，适合初学者
完整流程：涵盖从数据到部署的全流程，构建完整的PyTorch开发思维
模块化设计：代码结构清晰，便于理解和扩展
可视化结果：训练过程和结果可可视化，直观展示模型学习过程

2. 环境设置

2.1 安装PyTorch和相关库

2.1.1 原理讲解

环境设置是任何深度学习项目的第一步，它为后续的模型开发提供了必要的软件基础。在深度学习中，我们需要专门的框架来处理复杂的张量计算、自动微分和模型训练，而PyTorch正是目前最流行的框架之一。

PyTorch：由Facebook开发的开源深度学习框架，以其动态计算图（Eager Mode）、易用的API和强大的GPU加速能力而闻名。它允许开发者像编写普通Python代码一样定义和调试模型，极大降低了学习曲线。
torchvision：PyTorch的官方计算机视觉库，提供了常用的计算机视觉数据集（如MNIST、CIFAR-10）、预训练模型（如ResNet、VGG）和图像转换工具，简化了计算机视觉任务的开发流程。
numpy：Python的核心科学计算库，提供了高效的多维数组操作，与PyTorch张量兼容，常用于数据预处理和结果分析。
matplotlib：Python的绘图库，用于可视化训练过程、模型结果和数据分布，帮助开发者直观理解模型行为。

2.1.2 安装命令

# 安装PyTorch CPU版本
pip3 install torch torchvision torchaudio
# 安装其他必要库
pip3 install numpy matplotlib

复制代码

2.1.3 安装说明

torch：PyTorch核心库，提供张量操作、自动微分、模型定义和GPU加速等核心功能
torchvision：计算机视觉扩展库，包含MNIST数据集和图像转换工具
torchaudio：音频处理扩展库，本项目暂不使用
numpy：用于数值计算和数组操作，与PyTorch张量无缝转换
matplotlib：用于绘制训练曲线、准确率变化和数据可视化

2.2 导入所需库

2.2.1 原理讲解

导入库是Python编程的基础步骤，它允许我们使用外部库提供的功能和类。在深度学习项目中，我们需要导入多个库来完成不同的任务：数据处理、模型定义、训练优化和结果可视化。
每个导入的库都有特定的用途，它们共同构成了我们实现深度学习模型的工具集。通过合理组织导入语句，我们可以确保代码的可读性和可维护性。
2.2.2 导入代码

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader
from torchvision import datasets, transforms

复制代码

2.2.3 库的作用

torch：PyTorch核心模块，提供张量操作、自动微分和设备管理
torch.nn：神经网络模块，包含各种层（如Linear、Conv2d）、损失函数（如CrossEntropyLoss）和激活函数（如ReLU）
torch.optim：优化器模块，包含各种优化算法（如SGD、Adam），用于更新模型参数
torch.utils.data.DataLoader：数据加载器，用于批量加载数据，支持多进程加载和数据打乱
torchvision.datasets：包含常用数据集的实现，如MNIST、CIFAR-10等，简化了数据获取过程
torchvision.transforms：数据转换工具，用于图像预处理（如缩放、裁剪、标准化）

2.3 环境设置小节总结

通过环境设置步骤，我们完成了：

安装了PyTorch和相关库，包括torch、torchvision、numpy和matplotlib
了解了每个库的作用和用途
导入了后续代码中需要的所有模块和类

环境设置是深度学习项目的基础，它确保我们拥有所有必要的工具来实现和运行模型。良好的环境设置可以避免后续开发中出现依赖问题，提高开发效率。
3. 数据加载与预处理

3.1 数据转换定义

3.1.1 原理讲解

数据预处理是深度学习流程中至关重要的一步，它直接影响模型的训练效果和收敛速度。对于图像数据，原始格式通常是PIL图像或NumPy数组，而PyTorch模型需要接收张量格式的输入，并且对输入数据的分布有一定要求。
数据转换是将原始数据转换为模型可接受格式的过程，主要包括：

转换为张量：将PIL图像或NumPy数组转换为PyTorch张量，这是模型计算的基本数据类型
归一化：将像素值从[0, 255]范围缩放到[0, 1]范围，便于模型学习
标准化：将归一化后的数据转换为均值为0、标准差为1的分布，这有助于：
- 加速梯度下降算法的收敛
- 防止某些特征值过大导致的训练不稳定
- 统一不同特征的尺度，避免某个特征主导模型学习

3.1.2 转换代码

# 定义数据转换
# 包括转换为张量和标准化
transform = transforms.Compose([
transforms.ToTensor(), # 转换为张量
transforms.Normalize((0.1307,), (0.3081,)) # 标准化，均值0.1307，标准差0.3081
])

复制代码

3.1.3 关键参数说明

transforms.Compose：将多个转换操作组合成一个转换管道，数据会按顺序经过每个转换操作
transforms.ToTensor：将PIL图像或NumPy数组转换为PyTorch张量，并自动将像素值从[0, 255]归一化到[0, 1]
transforms.Normalize：标准化操作，计算公式为：(x - mean) / std
- 均值(0.1307)和标准差(0.3081)是MNIST数据集的全局统计值，由数据集官方提供，使用这些值可以确保输入数据分布合理

3.2 加载MNIST数据集

3.2.1 原理讲解

Dataset是PyTorch中表示数据集的抽象类，它定义了如何获取数据样本和对应的标签。为了方便开发者使用，PyTorch提供了torchvision.datasets模块，其中包含了多种常用的计算机视觉数据集实现，如MNIST、CIFAR-10、ImageNet等。
MNIST数据集是机器学习领域的经典数据集，由60,000张训练图像和10,000张测试图像组成，每张图像是28x28像素的灰度图，包含0-9中的一个手写数字。使用MNIST数据集的优点是：

数据集规模适中，适合初学者学习
任务明确（手写数字分类），评价标准清晰
不需要复杂的数据预处理，便于快速上手

3.2.2 加载代码

# 加载训练集
train_dataset = datasets.MNIST(
root='./data', # 数据保存路径
train=True, # 训练集
download=True, # 如果数据不存在，自动下载
transform=transform # 应用数据转换
)
# 加载测试集
test_dataset = datasets.MNIST(
root='./data',
train=False, # 测试集
download=True,
transform=transform
)

复制代码

3.2.3 数据集参数说明

root：指定数据保存的本地路径
train=True：加载训练集（60,000张图像）
train=False：加载测试集（10,000张图像）
download=True：如果指定路径下没有数据，自动从PyTorch官网下载
transform：指定数据转换管道，将原始数据转换为模型可接受的格式

3.3 创建数据加载器

3.3.1 原理讲解

DataLoader是PyTorch中用于批量加载数据的核心工具，它将Dataset包装成一个可迭代的对象，提供了以下关键功能：

批量处理：将数据分成多个批次，每次只处理一个批次，有效减少内存占用
数据打乱：训练时自动打乱数据顺序，防止模型学习到数据的顺序信息，提高模型泛化能力
并行加载：使用多个线程或进程加速数据加载，提高训练效率
自动批处理：自动将多个样本组合成批次，处理不同大小的输入数据

批次大小（batch_size）是一个重要的超参数，它影响：

模型训练的稳定性：较大的批次大小通常会带来更稳定的梯度，但需要更多内存
训练速度：合适的批次大小可以充分利用GPU并行计算能力
模型泛化能力：较小的批次大小可能带来更多的随机性，有助于模型泛化

3.3.2 加载器代码

# 批次大小
batch_size = 64
# 创建训练数据加载器
train_loader = DataLoader(
dataset=train_dataset,
batch_size=batch_size, # 每个批次的样本数
shuffle=True, # 训练集打乱
num_workers=0 # 在macOS上设置为0以避免多进程问题
)
# 创建测试数据加载器
test_loader = DataLoader(
dataset=test_dataset,
batch_size=batch_size,
shuffle=False, # 测试集不打乱
num_workers=0
)

复制代码

3.3.3 关键参数说明

batch_size=64：每次加载64个样本，这是一个常用的批次大小，平衡了训练速度和内存占用
shuffle=True：训练时打乱数据顺序，测试时不需要打乱（shuffle=False）
num_workers=0：数据加载的线程数，在macOS系统上设置为0可以避免多进程问题

3.4 数据加载小节总结

通过数据加载与预处理步骤，我们完成了从原始数据到模型可接受格式的转换：

定义数据转换管道：使用transforms.Compose组合了张量转换和标准化操作，确保输入数据格式正确、分布合理
加载MNIST数据集：使用torchvision.datasets.MNIST加载了训练集和测试集，自动处理了数据下载和基本格式转换
创建数据加载器：使用DataLoader实现了批量加载和数据打乱，为后续模型训练和测试提供了高效的数据访问方式

数据预处理是深度学习流程中的基础环节，良好的数据预处理可以显著提高模型的训练效果和收敛速度。通过PyTorch提供的工具，我们可以轻松实现复杂的数据预处理流程，专注于模型设计和训练。
4. 模型定义

4.1 全连接神经网络结构

4.1.1 原理讲解

神经网络是一种模仿生物神经网络结构和功能的计算模型，由大量人工神经元相互连接而成。它通过学习数据中的模式和特征，实现从输入到输出的复杂映射。
全连接神经网络（又称多层感知机，Multi-Layer Perceptron, MLP）是最基础的神经网络结构，其核心特点是：

全连接：每层的每个神经元与下一层的所有神经元相连
分层结构：包含输入层、隐藏层和输出层
非线性激活：必须使用激活函数引入非线性，否则无论多少层，网络都等同于线性模型

nn.Module是PyTorch中所有神经网络模型的基类，它提供了：

自动管理模型参数（权重和偏置）
定义前向传播的接口
模型保存、加载和迁移学习的支持
自动计算梯度的功能

激活函数是神经网络的关键组件，它将线性变换的结果转换为非线性输出，使网络能够学习复杂的非线性关系。常用的激活函数包括ReLU、Sigmoid、Tanh等，本项目使用ReLU（Rectified Linear Unit）激活函数。
4.1.2 模型代码

class MNISTClassifier(nn.Module):
def __init__(self, input_size, hidden_size, num_classes):
super(MNISTClassifier, self).__init__()
# 第一个全连接层
self.fc1 = nn.Linear(input_size, hidden_size)
# 激活函数
self.relu = nn.ReLU()
# 第二个全连接层（输出层）
self.fc2 = nn.Linear(hidden_size, num_classes)
def forward(self, x):
# 前向传播
# 展平输入：将28x28的图像转换为784维向量
x = x.view(x.size(0), -1) # 形状从(batch_size, 1, 28, 28)变为(batch_size, 784)
# 第一个全连接层 + 激活函数
x = self.relu(self.fc1(x))
# 第二个全连接层（输出层）
x = self.fc2(x)
return x

复制代码

4.1.3 模型结构说明

输入层：28x28=784个神经元，对应MNIST图像的每个像素值
隐藏层：128个神经元，使用ReLU激活函数，负责学习图像的中间特征
输出层：10个神经元，对应0-9共10个数字类别，输出每个类别的得分
nn.Linear：全连接层，执行线性变换 y = xW^T + b，其中W是权重矩阵，b是偏置向量
ReLU激活函数：数学公式为 f(x) = max(0, x)，将负数置为0，正数保持不变，引入非线性
前向传播：定义了数据从输入层流向输出层的路径，是模型计算的核心

4.2 模型初始化

4.2.1 原理讲解

模型初始化是创建模型实例并设置初始参数的过程。对于神经网络来说，初始化非常重要，合适的初始化可以加速模型收敛，避免梯度消失或爆炸问题。
在初始化模型时，我们需要指定以下关键参数：

input_size：输入特征的数量，MNIST图像展平后为28×28=784
hidden_size：隐藏层神经元的数量，这是一个超参数，需要根据任务复杂度调整
num_classes：输出类别的数量，MNIST为10个数字类别

PyTorch会自动为模型的权重和偏置初始化合适的初始值，通常使用 Xavier 或 Kaiming 初始化方法，这些方法考虑了网络层数和激活函数类型，有助于模型更快收敛。
4.2.2 初始化代码

# 模型参数设置
input_size = 28 * 28 # MNIST图像大小为28x28，展平后为784
hidden_size = 128 # 隐藏层神经元数量
num_classes = 10 # MNIST有10个类别（0-9）
# 实例化模型
model = MNISTClassifier(input_size, hidden_size, num_classes)

复制代码

4.2.3 模型结构查看

创建模型后，可以通过打印模型查看其完整结构：

MNISTClassifier(
(fc1): Linear(in_features=784, out_features=128, bias=True)
(relu): ReLU()
(fc2): Linear(in_features=128, out_features=10, bias=True)
)

复制代码

4.3 模型定义小节总结

通过模型定义步骤，我们完成了一个全连接神经网络的设计和初始化：

创建模型类：继承nn.Module创建了MNISTClassifier自定义模型类，这是PyTorch模型定义的标准方式
设计网络结构：定义了包含一个隐藏层的全连接网络，使用ReLU激活函数引入非线性
实现前向传播：定义了forward方法，明确了数据在网络中的流动路径，包括图像展平、线性变换和激活函数处理
初始化模型：创建了模型实例，设置了输入大小、隐藏层大小和输出类别数

这个模型将接收28×28的灰度图像作为输入，通过学习图像像素间的关系，输出10个数字类别的预测得分。模型定义是深度学习的核心环节，良好的模型设计直接影响最终的性能表现。
5. 损失函数和优化器

5.1 原理讲解

损失函数和优化器是深度学习模型训练的核心组件，它们共同决定了模型如何学习和改进。
损失函数

损失函数（Loss Function）是衡量模型预测值与真实标签之间差异的函数，它是模型训练的"指南针"，指导模型参数的调整方向。
对于分类任务，常用的损失函数包括：

交叉熵损失：适用于多分类问题，结合了softmax激活和负对数似然损失
二元交叉熵损失：适用于二分类问题
KL散度：衡量两个概率分布之间的差异

交叉熵损失是分类任务的首选，它的优点是：

对错误分类的惩罚更严厉
梯度计算稳定
自动处理标签的独热编码
结合了softmax激活，直接输出类别概率

交叉熵损失的数学公式为：

Loss = -Σ(y_i * log(p_i))

复制代码

其中，(y_i)是真实标签的独热编码，(p_i)是模型预测的类别概率。
优化器

优化器（Optimizer）是根据损失函数计算的梯度，调整模型参数，使损失最小化的算法。
常用的优化器包括：

随机梯度下降（SGD）：最基础的优化器，计算每个批次的梯度并更新参数
Momentum SGD：在SGD基础上添加动量项，累积之前的梯度方向，加速收敛并减少震荡
Adam：自适应学习率优化器，结合了动量和RMSProp的优点
RMSProp：根据梯度的平方移动平均调整学习率

动量是优化器的一个重要概念，它模拟了物理中的惯性，使参数更新更加平滑，减少震荡，加速收敛。动量值通常设置在0.9左右。
学习率是另一个关键超参数，它控制参数更新的步长：

学习率过大：可能导致模型发散，无法收敛
学习率过小：训练速度慢，可能陷入局部最优
合适的学习率：模型快速收敛，达到全局最优

5.2 代码实现

# 损失函数：交叉熵损失（适用于分类任务）
criterion = nn.CrossEntropyLoss()
# 优化器：随机梯度下降（SGD）
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.9)

复制代码

5.3 关键参数说明

nn.CrossEntropyLoss：交叉熵损失函数，适用于多分类任务
- 自动对模型输出应用softmax激活
- 自动处理整数标签，无需独热编码
- 结合了softmax和负对数似然损失
optim.SGD：随机梯度下降优化器
- model.parameters()：需要优化的模型参数（权重和偏置）
- lr=0.01：学习率，控制参数更新的步长
- momentum=0.9：动量参数，加速收敛并减少震荡
- weight_decay：可选参数，用于L2正则化，防止过拟合

5.4 损失函数和优化器小节总结

通过这一步，我们完成了模型训练核心组件的配置：

选择损失函数：选用交叉熵损失函数，适合MNIST多分类任务，它能有效衡量模型预测与真实标签的差异
配置优化器：选用带有动量的SGD优化器，学习率0.01，动量0.9，这是一个经典的配置，平衡了训练速度和稳定性
绑定模型参数：将优化器与模型参数绑定，使优化器能够直接调整模型的权重和偏置

损失函数和优化器是模型训练的核心，它们决定了模型如何从数据中学习。损失函数提供了学习的目标，优化器则提供了实现目标的方法。选择合适的损失函数和优化器，以及调整它们的超参数，是深度学习模型训练的重要技能。
6. 训练循环

6.1 训练函数

6.1.1 原理讲解

训练函数是深度学习模型学习的核心实现，它封装了完整的训练迭代过程。一个有效的训练函数需要实现以下关键功能：

前向传播（Forward Propagation）：将输入数据通过模型的各个层，得到预测输出。这个过程是模型根据当前参数生成预测的过程，也是计算损失的基础。
损失计算（Loss Calculation）：使用预设的损失函数，计算模型预测值与真实标签之间的差异。损失值是衡量模型当前性能的量化指标，也是后续参数更新的依据。
反向传播（Backward Propagation）：利用PyTorch的自动微分机制，从损失值开始，反向计算损失函数对模型所有参数的梯度。梯度表示了每个参数变化对损失值的影响方向和大小。
参数更新（Parameter Update）：使用优化器，根据计算得到的梯度调整模型参数。这是模型学习的核心步骤，通过不断调整参数，模型逐渐降低损失，提高预测准确率。
性能监控：在训练过程中，实时计算并打印损失和准确率等指标，帮助开发者监控模型训练状态。

model.train()：将模型设置为训练模式，这会启用训练特有的功能，如Dropout（随机失活神经元防止过拟合）和Batch Normalization（在训练时更新批统计信息）。
model.eval()：将模型设置为评估模式，关闭这些训练特有的功能，用于模型测试和推理。
6.1.2 训练函数代码

def train():
model.train() # 设置为训练模式
total_loss = 0.0
correct = 0
total = 0
for batch_idx, (images, labels) in enumerate(train_loader):
# 前向传播
outputs = model(images)
loss = criterion(outputs, labels)
# 反向传播和优化
optimizer.zero_grad() # 清空梯度
loss.backward() # 计算梯度
optimizer.step() # 更新参数
# 统计损失和准确率
total_loss += loss.item()
_, predicted = torch.max(outputs.data, 1) # 获取预测结果
total += labels.size(0)
correct += (predicted == labels).sum().item()
# 打印批次信息
if (batch_idx + 1) % 100 == 0:
print(f"Batch [{batch_idx+1}/{len(train_loader)}], Loss: {loss.item():.4f}")
# 计算平均损失和准确率
avg_loss = total_loss / len(train_loader)
accuracy = 100 * correct / total
print(f"Train - Loss: {avg_loss:.4f}, Accuracy: {accuracy:.2f}%")
return avg_loss, accuracy

复制代码

6.1.3 训练函数关键步骤详解

model.train()：将模型设置为训练模式，启用Dropout和Batch Normalization等训练特有的功能
outputs = model(images)：前向传播，模型根据当前参数对输入图像进行预测，得到每个类别的得分
loss = criterion(outputs, labels)：使用交叉熵损失函数计算预测得分与真实标签之间的损失值
optimizer.zero_grad()：清空之前批次计算的梯度，防止梯度累积导致参数更新错误
loss.backward()：自动微分，计算损失函数对所有模型参数（权重和偏置）的梯度
optimizer.step()：优化器根据梯度更新模型参数，实现模型学习
torch.max(outputs.data, 1)：获取每个样本预测得分最高的类别索引，得到最终预测结果
total_loss += loss.item()：累加当前批次的损失值，用于计算整个epoch的平均损失
correct += (predicted == labels).sum().item()：统计当前批次预测正确的样本数量
定期打印批次信息：每100个批次打印一次当前损失，帮助监控训练进度
计算并返回平均损失和准确率：用于评估整个epoch的训练效果

6.2 测试函数

6.2.1 原理讲解

测试函数用于评估模型在未见过的数据（测试集）上的表现，它是检验模型泛化能力的重要手段。与训练函数相比，测试函数具有以下特点：

评估模式：使用model.eval()将模型设置为评估模式，这会：
- 关闭Dropout层，确保所有神经元都参与计算
- 固定Batch Normalization层的统计信息，使用训练时学习到的均值和方差
- 确保模型在测试时的行为一致
关闭梯度计算：使用with torch.no_grad()上下文管理器关闭梯度计算，这能：
- 显著节省内存资源，因为不需要存储计算图用于反向传播
- 加速计算过程，提高测试效率
- 防止意外修改模型参数
无参数更新：测试过程只进行前向传播和损失计算，不执行反向传播和参数更新

测试的主要目的是：

评估模型的泛化能力，即对未见过数据的预测能力
监控模型是否过拟合（如果训练准确率远高于测试准确率，则可能过拟合）
确定模型的最终性能指标，如准确率、精确率、召回率等

6.2.2 测试函数代码

def test():
model.eval() # 设置为评估模式
total_loss = 0.0
correct = 0
total = 0
with torch.no_grad(): # 关闭梯度计算，节省内存
for batch_idx, (images, labels) in enumerate(test_loader):
# 前向传播
outputs = model(images)
loss = criterion(outputs, labels)
# 统计损失和准确率
total_loss += loss.item()
_, predicted = torch.max(outputs.data, 1)
total += labels.size(0)
correct += (predicted == labels).sum().item()
# 计算平均损失和准确率
avg_loss = total_loss / len(test_loader)
accuracy = 100 * correct / total
print(f"Test - Loss: {avg_loss:.4f}, Accuracy: {accuracy:.2f}%")
return avg_loss, accuracy

复制代码

6.3 执行训练

6.3.1 原理讲解

训练执行是指运行完整的训练循环，包括多个epoch的训练和测试。
训练轮次（epoch）是深度学习中的关键概念，它表示模型完整遍历整个训练集的次数。每个epoch通常包含两个阶段：

训练阶段：使用训练集更新模型参数，让模型学习数据特征
测试阶段：使用测试集评估模型性能，监控学习效果和泛化能力

epoch数量是一个重要的超参数：

过少的epoch：模型可能欠拟合，无法充分学习数据中的特征
过多的epoch：模型可能过拟合，对训练集表现很好，但对测试集表现较差
合适的epoch数量：模型在测试集上的性能达到峰值

在训练过程中，我们通常会观察：

训练损失：随着epoch增加，训练损失通常会逐渐降低
训练准确率：随着epoch增加，训练准确率通常会逐渐提高
测试损失：先降低后稳定，甚至可能上升（过拟合）
测试准确率：先提高后稳定，甚至可能下降（过拟合）

通过监控这些指标，我们可以判断模型是否收敛，是否出现过拟合，并决定何时停止训练。
6.3.2 训练执行代码

# 训练轮次
epochs = 10
print("开始训练MNIST全连接分类器...")
print(f"模型结构: {model}")
print(f"训练集大小: {len(train_dataset)}")
print(f"测试集大小: {len(test_dataset)}")
print(f"批次大小: {batch_size}")
print(f"训练轮次: {epochs}")
print("=" * 50)
# 训练和测试循环
for epoch in range(epochs):
print(f"\nEpoch [{epoch+1}/{epochs}]")
print("-" * 30)
train_loss, train_acc = train()
test_loss, test_acc = test()

复制代码

6.4 训练循环小节总结

通过训练循环，我们完成了模型从初始状态到训练完成的完整学习过程：

实现了训练函数：封装了前向传播、损失计算、反向传播和参数更新的完整流程，是模型学习的核心实现
实现了测试函数：用于评估模型在未见过数据上的泛化能力，监控模型是否过拟合
执行了10个epoch的训练：模型从随机初始化状态，逐渐学习到MNIST数据的特征和规律
监控了训练过程：每轮训练后打印训练和测试的损失及准确率，直观展示模型学习效果
防止了过拟合：通过训练集和测试集的对比，及时发现并监控过拟合情况

训练循环是深度学习模型学习的核心过程，它体现了"数据驱动"的机器学习理念。通过不断迭代和调整，模型能够从数据中自动学习到复杂的特征和规律，实现对新数据的准确预测。
训练循环的设计和实现直接影响模型的训练效率和最终性能，一个良好的训练循环应该：

高效利用计算资源
提供清晰的训练状态反馈
支持灵活的训练配置
便于扩展和修改

7. 模型保存与加载

7.1 保存模型

7.1.1 原理讲解

模型保存是深度学习流程中的重要环节，它允许我们将训练好的模型参数保存到文件中，以便后续使用，如模型部署、继续训练或分享给他人。
PyTorch提供了两种主要的模型保存方式：

保存模型参数（推荐）：
- 只保存模型的参数（权重和偏置），不保存模型结构
- 使用model.state_dict()获取模型参数，返回一个字典，键是参数名称，值是参数张量
- 占用空间小，灵活性高，支持跨设备和跨PyTorch版本加载
- 推荐使用这种方式，因为它允许我们灵活地修改模型结构，只要参数名称匹配即可加载
保存整个模型：
- 保存完整的模型对象，包括模型结构和参数
- 直接使用torch.save(model, 'model.pth')
- 占用空间大，灵活性差，可能存在版本兼容性问题
- 不推荐使用，因为它会将模型类的定义也保存下来，容易导致后续加载失败

state_dict是PyTorch中的核心概念，它是一个字典，包含了模型中所有可学习参数的名称和值。对于nn.Module对象，state_dict()方法会返回所有层的权重和偏置。
7.1.2 保存代码

# 保存模型参数
torch.save(model.state_dict(), 'mnist_fc_model.pth')
print("模型已保存为 mnist_fc_model.pth")

复制代码

7.2 加载模型

7.2.1 原理讲解

模型加载是将保存的模型参数加载到模型实例中，使其能够用于推理或继续训练。加载模型的过程包括以下关键步骤：

创建模型实例：首先需要创建一个与原模型结构完全相同的模型实例
加载参数文件：使用torch.load()函数加载保存的.pth文件，得到一个包含模型参数的字典
加载参数到模型：使用model.load_state_dict()方法将加载的参数字典应用到模型实例中
设置评估模式：使用model.eval()将模型设置为评估模式，关闭训练特有的功能（如Dropout）

模型加载时需要注意：

模型结构必须与保存时完全一致，否则会出现参数名称不匹配的错误
加载后需要将模型设置为评估模式，确保推理时的一致性
可以选择将模型加载到特定设备（如GPU）上，使用map_location参数

7.2.2 加载代码

# 加载模型
print("\n验证模型加载...")
loaded_model = MNISTClassifier(input_size, hidden_size, num_classes)
loaded_model.load_state_dict(torch.load('mnist_fc_model.pth'))
loaded_model.eval()

复制代码

7.3 测试加载后的模型

7.3.1 原理讲解

测试加载后的模型是验证模型加载是否成功的重要步骤。通过在测试集上运行加载后的模型，我们可以：

验证模型参数是否正确加载
确保模型在推理时能够正常工作
确认加载后的模型性能与原模型一致

测试加载后的模型过程与常规测试过程类似，使用with torch.no_grad()关闭梯度计算，提高推理效率。
7.3.2 测试代码

# 测试加载后的模型
with torch.no_grad():
correct = 0
total = 0
for images, labels in test_loader:
outputs = loaded_model(images)
_, predicted = torch.max(outputs.data, 1)
total += labels.size(0)
correct += (predicted == labels).sum().item()
loaded_acc = 100 * correct / total
print(f"加载后模型 - 测试集准确率: {loaded_acc:.2f}%")

复制代码

7.4 模型保存与加载小节总结

通过模型保存与加载步骤，我们完成了：

保存模型参数：将训练好的模型参数保存到mnist_fc_model.pth文件中，占用空间小，灵活性高
创建模型实例：创建了与原模型结构相同的模型实例
加载模型参数：成功将保存的参数加载到模型实例中
验证模型性能：测试了加载后的模型，确认其性能与原模型一致

模型保存与加载是深度学习流程中的重要环节，它具有以下作用：

保存训练成果：避免训练好的模型丢失，节省重复训练的时间和资源
模型部署：将训练好的模型部署到生产环境中，用于实际应用
迁移学习：基于预训练模型进行微调，加速新任务的训练
模型分享：方便将模型分享给他人，促进合作和交流

掌握模型保存与加载技术是深度学习工程师的必备技能，它能有效提高模型开发和部署的效率。
8. 完整代码

8.1 完整代码说明

完整代码是将前面所有章节的代码整合在一起，形成一个可以直接运行的完整程序。这个代码包含了从数据加载到模型保存的所有步骤，展示了PyTorch深度学习的完整工作流程。
完整代码的结构遵循了PyTorch开发的最佳实践：

模块化设计：将不同功能封装为独立的部分，便于理解和维护
清晰的流程：从数据处理到模型部署，每一步都有明确的划分
完整的注释：关键步骤都有详细注释，便于初学者理解
可扩展性：代码结构便于修改和扩展，可以轻松尝试不同的模型结构和超参数

8.2 完整代码实现

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader
from torchvision import datasets, transforms# 1. 数据加载与预处理# 定义数据转换transform = transforms.Compose([ transforms.ToTensor(), transforms.Normalize((0.1307,), (0.3081,))])# 加载MNIST数据集train_dataset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)test_dataset = datasets.MNIST(root='./data', train=False, download=True, transform=transform)# 创建数据加载器batch_size = 64train_loader = DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True, num_workers=0)test_loader = DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=False, num_workers=0)# 2. 模型定义class MNISTClassifier(nn.Module): def __init__(self, input_size, hidden_size, num_classes): super(MNISTClassifier, self).__init__() self.fc1 = nn.Linear(input_size, hidden_size) self.relu = nn.ReLU() self.fc2 = nn.Linear(hidden_size, num_classes) def forward(self, x): x = x.view(x.size(0), -1) x = self.relu(self.fc1(x)) x = self.fc2(x) return x# 模型初始化input_size = 28 * 28hidden_size = 128num_classes = 10model = MNISTClassifier(input_size, hidden_size, num_classes)# 3. 损失函数和优化器criterion = nn.CrossEntropyLoss()optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.9)# 4. 训练函数def train(): model.train() total_loss = 0.0 correct = 0 total = 0 for batch_idx, (images, labels) in enumerate(train_loader): outputs = model(images) loss = criterion(outputs, labels) optimizer.zero_grad() loss.backward() optimizer.step() total_loss += loss.item() _, predicted = torch.max(outputs.data, 1) total += labels.size(0) correct += (predicted == labels).sum().item() if (batch_idx + 1) % 100 == 0: print(f"Batch [{batch_idx+1}/{len(train_loader)}], Loss: {loss.item():.4f}") avg_loss = total_loss / len(train_loader) accuracy = 100 * correct / total print(f"Train - Loss: {avg_loss:.4f}, Accuracy: {accuracy:.2f}%") return avg_loss, accuracy# 5. 测试函数def test(): model.eval() total_loss = 0.0 correct = 0 total = 0 with torch.no_grad(): for batch_idx, (images, labels) in enumerate(test_loader): outputs = model(images) loss = criterion(outputs, labels) total_loss += loss.item() _, predicted = torch.max(outputs.data, 1) total += labels.size(0) correct += (predicted == labels).sum().item() avg_loss = total_loss / len(test_loader) accuracy = 100 * correct / total print(f"Test - Loss: {avg_loss:.4f}, Accuracy: {accuracy:.2f}%") return avg_loss, accuracy# 6. 训练和测试epochs = 10print("开始训练MNIST全连接分类器...")print(f"模型结构: {model}")print(f"训练集大小: {len(train_dataset)}")print(f"测试集大小: {len(test_dataset)}")print(f"批次大小: {batch_size}")print(f"训练轮次: {epochs}")print("=" * 50)for epoch in range(epochs): print(f"\nEpoch [{epoch+1}/{epochs}]") print("-" * 30) train_loss, train_acc = train() test_loss, test_acc = test()print("\n" + "=" * 50)print("训练完成！")print(f"最终测试准确率: {test_acc:.2f}%")# 7. 模型保存与加载# 保存模型torch.save(model.state_dict(), 'mnist_fc_model.pth')print("模型已保存为 mnist_fc_model.pth")# 加载模型
print("\n验证模型加载...")
loaded_model = MNISTClassifier(input_size, hidden_size, num_classes)
loaded_model.load_state_dict(torch.load('mnist_fc_model.pth'))
loaded_model.eval()# 测试加载后的模型
with torch.no_grad():
correct = 0
total = 0
for images, labels in test_loader:
outputs = loaded_model(images)
_, predicted = torch.max(outputs.data, 1)
total += labels.size(0)
correct += (predicted == labels).sum().item()
loaded_acc = 100 * correct / total
print(f"加载后模型 - 测试集准确率: {loaded_acc:.2f}%")print("\n完整流程演示结束！")

复制代码

8.3 如何使用完整代码

直接运行：将代码保存为mnist_classifier.py，然后在终端运行python mnist_classifier.py
修改超参数：可以尝试修改以下超参数，观察对模型性能的影响：
- batch_size：批次大小，影响训练速度和内存占用
- hidden_size：隐藏层神经元数量，影响模型复杂度
- lr：学习率，影响训练收敛速度
- momentum：动量参数，影响优化器性能
- epochs：训练轮次，影响模型训练程度
扩展功能：可以在代码基础上添加：
- 学习率调度器，自动调整学习率
- 模型性能可视化，绘制损失和准确率曲线
- 更复杂的模型结构，如增加隐藏层数量

完整代码是学习PyTorch的绝佳资源，通过修改和扩展它，你可以深入理解深度学习的各个方面，并逐步提高你的PyTorch编程技能。
9. 运行结果

9.1 运行结果说明

运行结果是模型训练过程和最终性能的直观展示，它包含了丰富的信息，可以帮助我们理解模型的学习过程和性能表现。
一个完整的运行结果通常包括以下几个部分：

模型基本信息：
- 模型结构：显示模型的层结构和参数数量
- 数据集大小：训练集和测试集的样本数量
- 超参数设置：批次大小、训练轮次等
训练过程信息：
- 每批次损失：显示每100个批次的训练损失，反映模型在当前批次的学习情况
- 每轮训练指标：包括训练损失和训练准确率，反映模型在训练集上的整体表现
- 每轮测试指标：包括测试损失和测试准确率，反映模型在未见过数据上的泛化能力
最终结果信息：
- 最终测试准确率：模型在测试集上的最终性能指标
- 模型保存和加载验证：验证模型保存和加载是否成功

9.2 示例运行结果

开始训练MNIST全连接分类器...模型结构: MNISTClassifier(
(fc1): Linear(in_features=784, out_features=128, bias=True)
(relu): ReLU()
(fc2): Linear(in_features=128, out_features=10, bias=True)
)训练集大小: 60000测试集大小: 10000批次大小: 64训练轮次: 10==================================================Epoch [1/10]------------------------------Batch [100/938], Loss: 0.5181Batch [200/938], Loss: 0.3630Batch [300/938], Loss: 0.3463Batch [400/938], Loss: 0.2737Batch [500/938], Loss: 0.3487Batch [600/938], Loss: 0.1979Batch [700/938], Loss: 0.2212Batch [800/938], Loss: 0.1741Batch [900/938], Loss: 0.1678Train - Loss: 0.3420, Accuracy: 89.95%Test - Loss: 0.1923, Accuracy: 94.34%Epoch [2/10]------------------------------Batch [100/938], Loss: 0.1911Batch [200/938], Loss: 0.1789Batch [300/938], Loss: 0.1182Batch [400/938], Loss: 0.1412Batch [500/938], Loss: 0.1278Batch [600/938], Loss: 0.1392Batch [700/938], Loss: 0.1214Batch [800/938], Loss: 0.1357Batch [900/938], Loss: 0.1144Train - Loss: 0.1612, Accuracy: 95.25%Test - Loss: 0.1309, Accuracy: 96.13%...Epoch [10/10]------------------------------Batch [100/938], Loss: 0.0338Batch [200/938], Loss: 0.0191Batch [300/938], Loss: 0.0315Batch [400/938], Loss: 0.0429Batch [500/938], Loss: 0.0510Batch [600/938], Loss: 0.0243Batch [700/938], Loss: 0.0319Batch [800/938], Loss: 0.0567Batch [900/938], Loss: 0.0468Train - Loss: 0.0471, Accuracy: 98.59%Test - Loss: 0.0743, Accuracy: 97.74%==================================================训练完成！最终测试准确率: 97.74%模型已保存为 mnist_fc_model.pth验证模型加载...加载后模型 - 测试集准确率: 97.74%完整流程演示结束！

复制代码

9.3 结果分析

结果分析是理解模型性能和训练过程的重要步骤，通过分析运行结果，我们可以：

评估模型学习过程：
- 训练损失从第1轮的0.3420逐渐降低到第10轮的0.0471，说明模型在不断学习和改进
- 训练准确率从第1轮的89.95%提高到第10轮的98.59%，表明模型在训练集上的分类能力不断增强
- 每批次损失逐渐降低，说明模型在每个训练批次中都在学习新的特征
评估模型泛化能力：
- 测试损失从第1轮的0.1923降低到第10轮的0.0743，说明模型的泛化能力在不断提高
- 测试准确率从第1轮的94.34%提高到第10轮的97.74%，表明模型在未见过数据上的表现良好
- 训练准确率和测试准确率的差距较小（98.59% vs 97.74%），说明模型没有出现过拟合
评估模型最终性能：
- 最终测试准确率达到97.74%，对于一个简单的全连接网络来说，这个结果非常优秀
- 模型保存和加载成功，加载后的准确率与原模型完全一致，说明模型保存机制正常工作
评估超参数效果：
- 批次大小64和学习率0.01的组合取得了良好的效果
- 10个训练轮次足以让模型收敛，继续增加轮次可能不会带来显著的性能提升

结果分析的关键点：

关注训练损失和测试损失的变化趋势，两者都应该逐渐降低并趋于稳定
关注训练准确率和测试准确率的差距，差距过大可能意味着过拟合
关注最终测试准确率，这是模型性能的核心指标
验证模型保存和加载功能是否正常工作

通过对运行结果的分析，我们可以全面了解模型的学习过程和性能表现，为后续的模型改进提供依据。
10. 总结

10.1 项目完成情况

项目完成情况总结了我们在这个PyTorch MNIST分类器项目中所完成的所有工作，展示了从环境搭建到模型部署的完整流程。
通过这个项目，我们成功实现了一个基于PyTorch的MNIST全连接分类器，完整覆盖了深度学习开发的各个环节：

环境设置：成功安装并配置了PyTorch和相关库，搭建了完整的深度学习开发环境
数据处理：
- 定义了数据转换管道，实现了图像的张量转换和标准化
- 加载了MNIST训练集和测试集
- 创建了数据加载器，实现了批量加载和数据打乱
模型设计：
- 设计并实现了一个包含两个全连接层的神经网络
- 使用ReLU激活函数引入非线性
- 完成了模型的初始化和结构定义
训练流程：
- 实现了完整的训练函数，包含前向传播、损失计算、反向传播和参数更新
- 实现了测试函数，用于评估模型泛化能力
- 执行了10个epoch的训练，模型性能逐渐提升
模型管理：
- 成功保存了训练好的模型参数
- 实现了模型加载功能
- 验证了加载后模型的性能与原模型一致

10.2 关键收获

关键收获总结了我们在项目中所学到的核心知识和技能，这些收获将为后续的深度学习学习奠定坚实的基础。

PyTorch工作流程：
- 掌握了PyTorch的完整开发流程，从数据加载到模型部署
- 理解了PyTorch的核心组件和它们之间的关系
- 学会了使用PyTorch实现深度学习模型的基本步骤
神经网络原理：
- 深入理解了全连接神经网络的结构和工作原理
- 掌握了激活函数的作用和选择原则
- 理解了损失函数和优化器的工作机制
- 掌握了动量等优化技术的原理和应用
训练过程：
- 掌握了前向传播、反向传播和参数更新的完整过程
- 理解了梯度下降算法的原理和实现
- 学会了监控训练过程和评估模型性能
模型评估与泛化：
- 学会了使用测试集评估模型性能
- 理解了过拟合和欠拟合的概念
- 掌握了防止过拟合的基本方法
模型管理：
- 掌握了模型保存和加载的方法
- 理解了state_dict的概念和作用
- 学会了验证模型加载的正确性

10.3 项目意义

项目意义阐述了这个项目对于深度学习初学者的重要价值和影响。

完整的入门案例：
- 提供了一个从入门到实践的完整案例，适合PyTorch初学者学习
- 涵盖了深度学习开发的所有关键环节，帮助初学者建立完整的知识体系
实践驱动的学习：
- 通过实践操作，加深对深度学习原理的理解
- 培养了动手能力和解决问题的能力
- 建立了学习深度学习的信心和兴趣
基础扎实的重要性：
- 强调了掌握基础概念和流程的重要性
- 为后续学习更复杂的模型（如CNN、RNN、Transformer等）打下了坚实基础
- 培养了良好的深度学习开发习惯和思维方式
可扩展的框架：
- 项目代码结构清晰，便于扩展和修改
- 可以作为其他深度学习项目的基础框架
- 鼓励初学者在此基础上进行创新和改进

这个项目的完成标志着你已经成功入门PyTorch深度学习，掌握了基本的开发流程和核心概念。通过这个项目的学习，你已经具备了进一步学习更复杂模型和应用的能力。
11. 扩展学习

11.1 模型改进方向

模型改进方向提供了多种改进当前模型性能的方法，通过尝试这些方法，你可以深入理解深度学习的各种技术和它们的效果。

尝试不同的模型结构：
- 增加隐藏层数量：将当前的2层网络扩展为3层或4层，观察深度对模型性能的影响
- 调整神经元数量：尝试不同的隐藏层神经元数量（如64、256、512等），找到最佳配置
- 原理：增加模型深度或宽度可以提高模型的表达能力，但也可能导致过拟合和训练困难
使用不同的优化器：
- Adam：自适应学习率优化器，结合了动量和RMSProp的优点，收敛速度快
- RMSprop：根据梯度的平方移动平均调整学习率，适合处理非平稳目标
- 原理：不同优化器有不同的参数更新策略，适合不同类型的任务和模型
- 实验：比较不同优化器在相同条件下的收敛速度和最终性能
调整学习率：
- 固定学习率：尝试不同的固定学习率（如0.1、0.001、0.0001等）
- 学习率调度器：使用StepLR、ReduceLROnPlateau等调度器自动调整学习率
- 原理：合适的学习率可以加速收敛，学习率调度可以在训练后期精细化调整
- 实验：观察不同学习率策略对训练过程的影响
添加正则化：
- Dropout：在训练过程中随机失活部分神经元，防止过拟合
- L2正则化：在损失函数中添加权重平方项，惩罚过大的权重
- 原理：正则化技术可以限制模型的复杂度，提高泛化能力
- 实验：比较添加正则化前后模型在测试集上的性能差异
数据增强：
- 随机旋转：将图像随机旋转一定角度（如±15度）
- 随机平移：将图像随机平移一定距离
- 随机缩放：将图像随机缩放一定比例
- 原理：数据增强可以扩大训练集规模，增加数据多样性，提高模型泛化能力
- 实验：比较使用数据增强前后模型的泛化能力

11.2 进阶模型实现

进阶模型实现介绍了几种更复杂的深度学习模型和技术，通过实现这些模型，你可以进一步提升自己的深度学习技能。

卷积神经网络（CNN）：
- 原理：CNN专门设计用于处理网格数据（如图像），通过卷积层自动提取局部特征
- 结构：通常包含卷积层、池化层和全连接层
- 优势：相比全连接网络，CNN参数更少，特征提取能力更强
- 实验：实现一个简单的CNN模型，比较其与全连接网络在MNIST数据集上的性能差异
循环神经网络（RNN）：
- 原理：RNN专门设计用于处理序列数据，通过隐藏状态保存上下文信息
- 应用：虽然MNIST是图像数据，但也可以将其视为28x28的序列数据
- 实验：使用LSTM或GRU等RNN变体处理MNIST数据，观察其性能
迁移学习：
- 原理：利用预训练模型的特征提取能力，在新任务上进行微调
- 应用：虽然MNIST是简单数据集，但可以尝试使用在ImageNet上预训练的模型进行特征提取
- 实验：比较使用预训练特征和从头训练的性能差异
PyTorch Lightning：
- 原理：PyTorch Lightning是PyTorch的高级封装，简化了训练代码，提高了代码的可读性和可维护性
- 优势：自动处理设备管理、分布式训练等复杂问题
- 实验：使用PyTorch Lightning重写当前模型，体验其简化效果
模型部署：
- 原理：将训练好的模型部署到实际应用中，如Web或移动设备
- 方法：使用TorchScript、ONNX等格式导出模型，然后在不同平台上部署
- 实验：将MNIST模型部署到Web应用中，实现实时手写数字识别

11.3 学习资源推荐

学习资源推荐提供了一些高质量的深度学习学习资源，帮助你进一步深入学习PyTorch和深度学习。

官方文档：
- PyTorch官方文档：https://pytorch.org/docs/stable/ - 最权威的PyTorch学习资源，包含详细的API说明和教程
- torchvision文档：https://pytorch.org/vision/stable/ - 计算机视觉相关的PyTorch扩展库文档
在线课程：
- Fast.ai Practical Deep Learning for Coders：https://www.fast.ai/ - 注重实践的深度学习课程，适合初学者
- Deep Learning Specialization (Coursera)：https://www.coursera.org/specializations/deep-learning - Andrew Ng的经典深度学习课程
- PyTorch Tutorials：https://pytorch.org/tutorials/ - PyTorch官方提供的教程，涵盖各种主题
书籍：
- 《Deep Learning with PyTorch》：Eli Stevens等著，详细介绍PyTorch的使用和深度学习原理
- 《动手学深度学习》：李沐等著，包含丰富的PyTorch实现示例
- 《深度学习》：Ian Goodfellow等著，深度学习领域的经典教材
GitHub项目：
- PyTorch官方示例：https://github.com/pytorch/examples - 包含各种经典深度学习模型的PyTorch实现
- Awesome PyTorch：https://github.com/bharathgs/Awesome-pytorch-list - 收集了大量PyTorch相关的资源和项目
社区资源：
- PyTorch论坛：https://discuss.pytorch.org/ - 官方论坛，可提问和交流PyTorch相关问题
- Stack Overflow：https://stackoverflow.com/questions/tagged/pytorch - 解决具体技术问题的好地方
- Reddit r/pytorch：https://www.reddit.com/r/pytorch/ - 关注PyTorch最新动态和社区讨论

通过不断学习和实践这些扩展内容，你可以逐步提高自己的深度学习技能，从入门到精通，最终能够独立设计和实现复杂的深度学习模型。
12. 结束语

通过本项目的学习，你已经掌握了PyTorch的基本工作流程和核心概念，能够独立实现简单的深度学习模型。深度学习是一个不断发展的领域，需要持续学习和实践。希望这个项目能成为你深度学习之旅的良好开端，祝你在学习和实践中不断进步！

来源：程序园用户自行投稿发布，如果侵权，请联系站长删除
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

哈梨尔 · 2025-12-29 00:06:25

用心讨论，共获提升！

阕阵闲 · 2025-12-30 18:10:26

感谢，下载保存了

缄戈 · 2026-1-14 14:31:27

感谢，下载保存了

殳世英 · 2026-1-14 23:03:42

过来提前占个楼

段干叶农 · 2026-1-16 17:34:44

懂技术并乐意极积无私分享的人越来越少。珍惜

阕阵闲 · 2026-1-19 02:57:33

谢谢分享，试用一下

劳暄美 · 2026-1-19 04:28:52

东西不错很实用谢谢分享

腥狩频 · 2026-1-19 10:39:47

感谢分享，下载保存了，貌似很强大

勺缓曜 · 2026-1-20 01:07:47

谢谢分享，试用一下

戟铵腴 · 2026-1-20 22:34:34

前排留名，哈哈哈

孟清妍 · 2026-1-21 06:41:33

鼓励转贴优秀软件安全工具和文档！

贡醮 · 2026-1-25 10:27:45

用心讨论，共获提升！

飧沾 · 2026-1-27 07:12:27

不错，里面软件多更新就更好了

泠邸 · 2026-1-28 10:14:12

分享、互助让互联网精神温暖你我

粒浊 · 2026-1-30 05:23:06

这个好，看起来很实用

别萧玉 · 2026-2-2 05:00:25

新版吗？好像是停更了吧。

扈怀易 · 2026-2-4 07:35:16

感谢分享

芮梦月 · 2026-2-6 07:28:12

感谢分享

碛物 · 2026-2-7 07:39:42

yyds。多谢分享

账号		自动登录	找回密码
密码			立即注册

PyTorch MNIST全连接分类器完整流程

相关帖子

回复

浏览过的版块

签约作者

PyTorch MNIST全连接分类器完整流程

相关帖子

相关推荐

回复

浏览过的版块

签约作者