基于pytorch构建一个非常简单的卷积神经网络，以Mnist数据集为例演示基本的流程

1、导工具包

2、读取数据

（把该写的超参数全部写出来）

PS：当前输入图像的大小，注意这里使用卷积网络处理Mnist数据他就不是一个一个像素点了，既然我们要用卷积网络去做，那输入的他得是一张图像，对于一张图像我们现在的输入得是28x28x1的三维的数据，我们现在需要的数据他是三维的 $h\times w\times c$ 他是三维的。

3、卷积网络模块构建

定义的conv1不光是做了一个卷积，他是一个卷积模块，包含了卷积、池化、Relu全部加进去了，

定义conv2也是一个卷积模块；

在做卷积层的时候其实很简单，需要在nn模块当中，把Conv2d拿出来就可以了，其中：

in_channel：表示当前输入的特征图个数，对于第一个卷积来说，他的输入应该是我们的Mnist数据，这个数据是一个灰度图，所以说他的In_channels=1，这是我输入的颜色通道，或者说输入特征图的个数；

out_channels：表示输出特征图的个数，就是说你用多少个卷积核来对当前数据或者对当前的这个图进行特征提取，这里的16表示你用16个卷积核，16个不同的卷积核，肯定会得到16个不同的特征图，所以out这里的意思就是你想得到多少个特征图的意思；

kernel_size：表示我们现在做卷积，你得告诉我我每隔多大的区域进行特征提取，这里等于5就是我用一个5x5的区域来去在当前原始的输入图像当中进行特征提取，kernel_size=5表示卷积核的大小；

stride：表示当前的步长；我在做卷积的窗口进行滑动过程当中，每隔几个单元滑动，一般情况下步长都是为1的。

padding：表示做边缘填充；这里为2表示加2圈0。

PS：如果不想写这些参数的名字，直接向nn.Conv2d那样直接全部输入数字也行。

在nn.Conv2d中的16表示输入，之前输入是1表示灰度图默认就是1，

这里的16表示（大家记住一点就是我当前这个卷积层他的输入大小就是之前得到多少个特征图）之前得到的16个特征图，所以这里我们的输入也是16；

32表示使用32个卷积核去提取特征，得到的是32个图；

5表示kernel_size=5；

3.1、拉伸操作

在做卷积的时候，最后不管是卷积层还是Relu层还是pooling层，无论这三个层中的哪一个，我们最终得到的都是一个特征图，所谓这个特征图不考虑batch_size的前提下，他是一个三维的 $h\times w\times c$ ，比如我最终得到的是一个32x32x256的结果，他是一个图，他不是一个矩阵，我们最终需要得到一个10分类的结果，怎么样得到一个10分类的结果呢？现在我需要把这个立体的东西给他拉长，转成一个矩阵或者说是向量，比如说这里他是一个2048维度(假设的)的向量，接下来我连接上一个全连接层(一个权重参数w，一个偏置参数b)，我就能得到我最终预测出来的一个结果，比如说10个类别，我就能够去做了。

PS：所以说这里我得多做一步，把当前得到的特征图，给他拉长，拉成一个长向量，基于这个向量我才能对他做一个全连接层，得到最终的一个预测结果，所以这里有一步拉长的操作。

在做拉长操作之前还得做一件事，我们得知道，你最后一层这个全连接层里边这个w他的一个维度，w的第2维度很简单肯定是个10，因为得到的是10个类别，第一个维度就是你得到这个特征图里边他有多少个特征，这里的2048就是把3个数乘在一起，所以在做卷积的时候最后得到的这个特征图他的规格，它的大小是等于多少。

这里我们计算一下他得到的特征图大小是多少？

一开始输入是28x28x1--------------------->经过第一个卷积层之后得到28x28x16(因为用了16个卷积核)------------->经过Relu不变还是28x28x16------------->经过最大池化层是14x14x16，------------>经过第二个卷积层是14x14x32（因为用了32个卷积核)------------->经过Relu不变还是14x14x32------------->经过最大池化层是7x7x32，所以最终的w第一个维度就等于1568=7x7x32，第二个维度是10；

根据计算公式： $h=\frac{h-F_{h}+2P}{s}+1$

所以写了一个最终输出层，输出层里边我们是全连接操作，然后全连接里边他是32X7x7表示经过这几次卷积之后得到的一个结果，10就是最终想要输出的类别的个数。

3.2、把网络串起来

之后进行前向传播，前向传播比较简单，一开始经过conv1，再经过conv2，下一句特别的，做了一个reshape操作(x=x.view(x.size(0),-1))，这个reshape操作就是刚才说的咱们得把当前结果转化成全部向量的格式(因为下一层要做全连接了)，接下来用向量再乘上我的全连接层，就是wx+b，最终就得到了当前这个输入属于10个类别中的各自的一个结果。