什么是神经网络？工作原理是什么？——AI算法必懂-EDN 电子技术设计

 关注AI的同学一定都知道神经网络，这是AI算法中模拟人的大脑所衍生出来的学科和算法。可以说，不了解神经网络就不能说动算法，懂算法者必懂神经网络。下面我们就对神经网络的工作原理进行深入浅出的介绍。

关注AI的同学一定都知道神经网络，这是AI算法中模拟人的大脑所衍生出来的学科和算法。可以说，不了解神经网络就不能说动算法，懂算法者必懂神经网络。下面我们就对神经网络的工作原理进行深入浅出的介绍。8FTednc

一文了解神经网络工作原理 8FTednc

深度学习是机器学习中重要分支之一。它的目的是教会计算机做那些对于人类来说相当自然的事情。深度学习也是无人驾驶汽车背后的一项关键性技术，可以帮无人车识别停车标志、区分行人与路灯柱。它是手机、平板、电视和免提扬声器等设备实现语音控制的关键。深度学习近期以其前所未有的成果获得了广泛关注。8FTednc

在深度学习中，计算机模型直接从图像、文本或声音中学习直接如何执行分类任务。深度学习模型可以达到最高的准确度，有时甚至超过了人类的水平。我们通常使用大量标记的数据和包含许多层的神经网络体系结构来训练模型。8FTednc

一文了解神经网络工作原理 8FTednc

8FTednc

深度学习的模型可应用到各种复杂任务中：8FTednc

1. 人工神经网络（ANN）进行回归和分类8FTednc

2. 用于计算机视觉的卷积神经网络（CNN）8FTednc

3. 递归神经网络（RNN）用于时间序列分析8FTednc

4. 自组织地图以进行特征提取8FTednc

5. 推荐系统的深玻尔兹曼机8FTednc

6. 推荐系统的自动编码器8FTednc

在本文中，我们将尽可能的介绍人工神经网络（ANN）的所有相关内容。8FTednc

“人工神经网络（ANN）是一种信息处理范例，它受到生物神经系统（大脑）信息处理方式的启发。由大量高度互连的处理元件（神经元）组成，这些元件协同工作以解决特定问题。”8FTednc

8FTednc

主要内容：8FTednc

1. 神经元8FTednc

2. 激活功能8FTednc

3. 激活功能的类型8FTednc

4. 神经网络如何工作8FTednc

5. 神经网络如何学习（反向传播）8FTednc

6. 梯度下降8FTednc

7. 随机梯度下降8FTednc

8. 随机梯度下降训练神经网络8FTednc

神经元8FTednc

神经元（也称为神经细胞）是大脑和神经系统的基本单元，通过树突接收来自外部世界的刺激信息，对该信息进行处理后，通过轴突输出给其他细胞。8FTednc

一文了解神经网络工作原理 8FTednc

8FTednc

生物神经元8FTednc

细胞体（Soma）：神经元细胞的主要部分，包含细胞核，进行必要的生化反应。8FTednc

树突：神经元周围类似头发的管状结构。主要负责接受输入信号。8FTednc

轴突：这是一种细长的管状结构，类似于传输线。8FTednc

突触：神经元以复杂的空间排列相互连接。轴突末端再次分支，是一种高度复杂、高度专一的结构，我们称之为突触。两个神经元之间的联系就发生在这些突触处。8FTednc

树突接收其他神经元信息输入。细胞体处理这些传入信息，得到相应的输出结果，该结果通过轴突和突触发送到其他神经元。8FTednc

一文了解神经网络工作原理 8FTednc

电信号流过神经元。8FTednc

下图代表了受生物神经元启发的ANN一般模型。它也被称为感知器。8FTednc

单层神经网络一般称为感知器，给定输入它将计算得到输出。8FTednc

一文了解神经网络工作原理 8FTednc

感知器8FTednc

在上图中，x0, x1, x2, x3...x(n)代表该网络的输入（独立变量），每一个输入在经过所谓的树突时都要乘以相应的权重。该权重表示为w0, w1, w2, w3….w(n)，它显示特定节点的强度。b是偏差值。偏差值可以向上或向下移动激活函数。8FTednc

最简单的情况，将这些乘积相加并输入传递函数（激活函数）得到结果，然后将该结果作为输出发送。8FTednc

激活函数8FTednc

激活函数对于ANN学习和理解真正复杂的东西很重要。它们的主要目的是将ANN中节点的输入信号转换为输出信号，此输出信号将作为下一层的输入。8FTednc

激活函数通过计算加权总和偏差值来决定是否激活该神经元。目的是引入非线性。8FTednc

如果我们不应用激活函数，那么输出信号将仅仅是线性函数（一阶多项式）。线性函数很容易求解，功耗也相对较小，但是它们的复杂性受到一定的限制。因此没有激活函数，我们的模型就无法进行学习，也无法对复杂的数据进行建模，例如图像，视频，音频，语音等。8FTednc

为什么我们需要非线性函数？8FTednc

非线性函数是一种具有曲率的函数。现在我们需要神经网络能够进行学习，能够表示将输入映射到输出的任意复杂函数。因此神经网络也被认为是 “通用函数逼近器”。8FTednc

激活函数的类型：8FTednc

1. 阈值激活函数—（二进制阶跃函数）8FTednc

二进制阶跃函数是基于阈值的激活函数。如果输入值高于某个阈值，则神经元被激活并将完全相同的信号发送到下一层；低于某个阈值则不被激活。8FTednc

一文了解神经网络工作原理 8FTednc

二进制函数8FTednc

此函数的问题是创建一个二进制分类器（1或0），但是如果我们要连接多个这样的神经元以引入更多类，如Class1、Class2、Class3等。在这种情况下，所有神经元都将给出1 ，我们将无法进行判断。8FTednc

2. Sigmoid激活函数-（逻辑函数）8FTednc

Sigmoid函数是一种数学函数，具有特征性的“ S”形曲线或S型曲线，范围在0到1之间，因此它用于需要预测概率为输出。8FTednc

一文了解神经网络工作原理 8FTednc

Sigmoid曲线8FTednc

Sigmoid函数是可微的，这意味着我们可以求解任意2个点的曲线斜率。Sigmoid激活函数的缺点是，如果提供较大的负输入，则可能导致神经网络在训练时卡住。8FTednc

3. 双曲正切函数—（tanh）8FTednc

类似于Sigmoid，但性能更好。它本质上是非线性的，因此我们可以对各层进行叠加。该函数的范围是（-1,1）。8FTednc

一文了解神经网络工作原理 8FTednc

双曲正切函数8FTednc

此功能的主要优点是，负输入映射为负输出，而只有零值输入会被映射为接近零输出。因此，在训练过程中卡顿的可能性较小。8FTednc

4. 整流线性单元-（ReLu）8FTednc

ReLu是CNN和ANN中最常用的激活函数，范围从零到无穷大。[0，∞]8FTednc

一文了解神经网络工作原理 8FTednc

ReLu8FTednc

如果x为正，则给出输出为“ x”；如果x为负，否则输出为0。ReLu看起来是线性函数的问题，但本质上是非线性的，并且ReLu的组合也是非线性的。实际上，它是一个很好的近似器，可以通过组合Relu来近似大部分函数。8FTednc

它一般应用于神经网络的隐藏层。对于输出层而言，分类问题通常使用softmax函数，回归问题使用线性函数。8FTednc

这里存在的一个问题是，某些梯度在训练过程中可能会消失。这会导致权重更新，任何数据点都无法激活该神经元。ReLu基本导致了神经元的死亡。8FTednc

为了解决这一问题，引入了Leaky ReLu。Leaky ReLu引入了一个小斜率来保证不出现上述问题。Leaky ReLu范围从-∞到+∞。8FTednc

一文了解神经网络工作原理 8FTednc

ReLu vs Leaky ReLu8FTednc

Leaky增加了ReLu函数的输出范围。通常，a = 0.01。当a不为0.01时，则称为随机ReLu。8FTednc

神经网络如何工作？8FTednc

让我们以房地产价格为例，首先，我们将不同的因素汇总到一行数据中： Area, Bedrooms, Distance to city and Age.8FTednc

一文了解神经网络工作原理 8FTednc

输入值通过加权的突触直接到达输出层。四个输入值均会被分析并输入到激活函数中，产生输出结果。8FTednc

这很简单，但是通过在输入和输出层之间添加一个隐藏层可以扩大神经网络的功能并提高其准确性。8FTednc

一文了解神经网络工作原理 8FTednc

具有隐藏层的神经网络（仅显示非0值）8FTednc

现在在上图中，所有4个变量都通过突触连接到神经元。但是，并非所有的突触都被加权。权值包括0值和非0值。在这里，非零值表示重要性，0值表示输入被丢弃。8FTednc

让我们以第一个神经元的Area和Distance to City为非零的示例为例，这意味着它们对第一个神经元重要。另外两个变量，Bedrooms而Age权值为0，因此不通过第一神经元。8FTednc

您可能想知道为什么第一个神经元只考虑四个变量中的两个。距离城市越远房子变得越便宜，这在房地产市场上很普遍。因此，这个神经元所做的事情可能是寻找离市区较近的房屋。8FTednc

神经元很多，每个神经元用这些变量的不同组合进行相似的计算。一旦满足标准，神经元就会使用激活函数进行计算。8FTednc

下一个神经元加权的突触可能是Distance to the city和Bedrooms。因此神经元以非常灵活的方式工作，全面的搜索以查找特定的事物。8FTednc

神经网络如何学习？8FTednc

让我们先来做一个类比。神经网络的学习与我们正常的学习方式密切相关，我们首先完成一定的工作，并得到教练的纠正，下一次以更好的方式来完成这个工作。类似地，神经网络需要培训者，来描述该网络对输入做出的反应。用实际值和预测值之间的差异，计算一个误差值（也称为成本函数），并将其发送回系统。8FTednc

成本函数：实际值与输出值之间平方差的一半。8FTednc

对于网络的每一层，都会分析成本函数，并用其调整下一个输入的阈值和权重。我们的目标是使成本函数最小化。成本函数越低，实际值就越接近于预测值。这样随着网络的不断学习，每次运行的误差都减小。8FTednc

我们通过整个神经网络反馈结果数据。将输入变量连接到神经元的加权突触是我们唯一可以控制的事情，因此只要实际值和预测值之间存在差异，我们就需要调整权重。一旦稍微调整它们并再次运行神经网络，便会产生一个新的成本函数，我们希望它可以比上一个小。重复此过程，直到将成本函数降低到尽可能小的水平为止。8FTednc

一文了解神经网络工作原理 8FTednc

上述过程称为反向传播，并通过网络连续进行，直到将误差值保持在最小值为止。一文了解神经网络工作原理 8FTednc

反向传播8FTednc

调整权重的方法有两种：8FTednc
1.蛮力方法8FTednc
2.批梯度下降8FTednc

蛮力法8FTednc

适合单层前馈网络。在这里，我们需要考虑许多可能的权重。在这种方法中，我们想要舍弃除U形曲线底部权值以外的所有其他权重。最佳权值可以使用简单的消除技术找到。如果我们只需要优化一个权重，那么这种方法很有效。但如果是具有许多权重的复杂神经网络，该方法将因维数太高而无法实现。8FTednc

分批梯度下降8FTednc

它是一阶迭代优化算法，在训练具有不同权重模型的过程中找到最小成本值（损失）。8FTednc

一文了解神经网络工作原理 8FTednc

梯度下降8FTednc

在“梯度下降”过程中，我们不会一次都查看每个权重并剔除错误的权重，而是查看函数斜率。8FTednc

如果斜率→负值，则表示您沿着曲线下降。8FTednc
如果斜率→正，则不执行任何操作8FTednc

这样，可以消除大量不正确的权重。8FTednc

随机梯度下降（SGD）8FTednc

如上图所示，当我们具有凸曲线时，渐变下降效果很好。但是，如果我们没有凸曲线，则渐变下降将失败。8FTednc

“ 随机 ” 一词是指与随机概率相关的系统或过程。因此，在随机梯度下降中，随机选择一些样本，而不是每次迭代的整个数据集。8FTednc

一文了解神经网络工作原理 8FTednc

随机梯度下降8FTednc

在SGD中，我们一次获取一行数据，通过神经网络运行该数据，然后调整权重。对于第二行，我们运行它，然后比较Cost函数，然后再次调整权重。8FTednc

SGD帮助我们避免了局部极小值的问题。它比Gradient Descent快得多，因为它一次运行每一行，并且不必将整个数据加载到内存中即可进行计算。8FTednc

要注意的一件事是，由于SGD通常比典型的Gradient Descent噪声更大，因此由于其下降的随机性，通常需要更多的迭代次数才能达到最小值。尽管与典型的Gradient Descent相比，它需要更多的迭代次数才能达到最小值，但在计算消耗上仍比典型的Gradient Descent少得多。因此，在大多数情况下，SGD优于分批梯度下降。8FTednc

利用随机梯度下降训练神经网络8FTednc

步骤1→将权重随机初始化为接近0但不为0的小数。8FTednc

步骤2→在输入层中输入数据集的第一个观测值，每个要素放在一个节点中。8FTednc

步骤3→ 正向传播：从左到右，神经元按顺序被激活，直到获得预测值。每个神经元的影响都受权重的限制。8FTednc

步骤4→将预测结果与实际结果进行比较，并测量的误差（成本函数）。8FTednc

步骤5→ 反向传播：从右到左，误差反向传播。根据它们对错误造成的影响来更新权重。学习率决定了我们更新权重的程度。8FTednc

步骤6→重复步骤1至5，并在每次比较后更新权重（强化学习）8FTednc

步骤7→当整个训练集通过ANN时，就完成了。8FTednc

8FTednc

结语8FTednc

一文了解神经网络工作原理神经网络是一个全新的新概念，它还有很大潜力。可以应用于各种不同的概念中，并在测试阶段通过特定的反向传播和纠错机制进行学习。这些多层系统也许可以有一天仅靠学习来减少发生错误的可能性，而无需人工纠正。8FTednc

责编：Challey8FTednc

更多关于AI、算法方面的技术交流可以加责编微信（同名）。8FTednc

阅读全文，请先

人工智能自动驾驶操作系统无人机/机器人

上一篇： 完全自动驾驶到来了吗？——AutoX上演完全无人驾驶，乘客成“演员” 下一篇： 生物嗅觉无人机——微型无人机发展的新方向

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

极海推出全球首款双核Cortex-M52实时控制MCU/DSP 随着机器人技术的不断发展，其应用领域从传统的工业制造逐步拓展至医疗、农业等多个新兴领域，这对机器人的控制系统提出了更高的要求，当前机器人控制系统当前主要面临高爆发、高动态、高精度和高安全这四方面的挑战···
情境感知AI：利用FPGA技术增强边缘智能现场可编程门阵列（FPGA）的灵活性、现场升级能力和互操作性，结合其低功耗、低延迟和并行处理能力，使其成为开发者克服挑战并优化情境边缘AI应用的关键工具。
ADAS 系统中的传感器创新如何在道路交通中挽救生命在本文中，我们将探讨 ADAS 在提高道路安全方面的作用，以及各种对实现这一目标至关重要的传感器技术。
JEDEC最终确定HBM4标准，内存大厂的更新进度如何？近日，JEDEC宣布发布HBM4 DRAM标准，为AI和HPC提供更高的带宽、效率和容量···
智能眼镜的困境和解法：“百镜大战”的未来在哪儿？ Ray-Ban Meta AI眼镜可能带火了整个智能眼镜市场，但智能眼镜的发展仍受到“不可能三角”的制约，有人开始做新标准，有人在做新生态......解决问题的关键会是什么？
中国“破晓(PoX)”皮秒闪存器件问世，问鼎全球最快近日，复旦大学的研究团队研制出一款名为“破晓(PoX)”的皮秒闪存器件，打破了现有存储速度的理论极限···
视觉Transformer已经超越CNN：原因分析以及如何发挥它们本文将探讨ViT成为首选的原因、ViT的关键不同之处，以及要最大限度地发挥其的性能，哪些硬件功能必不可少。
下一代可穿戴设备和边缘人工智能改进运动表现分析在现代体育运动中，胜负往往取决于数毫秒或数毫米之间。然而，即使十分精确地量度速度和距离，其本质仍然是相当初级的数据···
从传统到科技：触觉技术如何重塑健康产业随着消费者的健康意识不断增强，以及对科技的了解日益加深，他们对于通过科技赋能的健康产品和服务的需求正持续提升···
用上Zen5架构，AMD第五代霄龙嵌入式处理器有多强？如今的嵌入式计算市场正经历着巨大的变革，人工智能驱动的网络流量激增、数据爆炸式增长以及工业边缘算力需求的扩张，让传统嵌入式处理器面临着前所未有的性能与可靠性挑战···
2025年及未来半导体行业的八大趋势从近期的历史来看，未来一年及以后，科技领域将取得一些惊人的进步，变革的步伐将继续加快···
兆易创新推出GD25NE系列SPI NOR Flash：专为1.2V SoC 业界领先的半导体器件供应商兆易创新GigaDevice宣布推出专为1.2V SoC应用打造的双电压供电SPI NOR Flash产品——GD25NE系列···

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

什么是神经网络？工作原理是什么？——AI算法必懂