前向传播

输入进入网络,经过每一层变换,最终变成输出——就像原材料在工厂流水线上一步步加工成产品。

🏭 工厂流水线
第1章:你学会了单个工人(感知机)怎么做决策。
第2章:你学会了每台机器的"加工方式"(激活函数)。
本章:把工人和机器连成一条流水线,看原材料(输入数据)怎么一步步变成产品(预测结果)。

前向传播 = 信息从输入层流向输出层的过程。每经过一层:先加权求和,再过激活函数,然后传给下一层。

🔢 从 2 个输入到 1 个输出

先回到最简单的网络:2 个输入 → 2 个隐藏神经元 → 1 个输出。拖拽滑块改变输入,看数字如何流动。
输入
x₁
x₂
隐藏层
h₁
h₂
输出
y
0.5
0.3
# 隐藏层神经元 1
z₁ = 0.8×0.5 + 0.4×0.3 + (-0.2) = 0.00
h₁ = ReLU(0.00) = 0.00

# 隐藏层神经元 2
z₂ = -0.3×0.5 + 0.7×0.3 + 0.1 = 0.00
h₂ = ReLU(0.00) = 0.00

# 输出层
z₃ = 0.6×0.00 + -0.5×0.00 + 0.2 = 0.00
y = Sigmoid(0.00) = 0.00
输入 (x₁=0.5, x₂=0.3) → 输出 y = 0.00

🧩 前向传播的完整步骤

无论网络多大,前向传播永远就三步:
加权求和
z = Σ(w·x) + b
激活函数
a = ReLU(z) / Sigmoid(z)
传给下一层
输出 = 下一层的输入
重复这三步,直到最后一层输出结果。这就是前向传播——所有神经网络预测的方式都一样,从最简单的感知机到 GPT 都是如此。