广告

什么是神经网络?工作原理是什么?——AI算法必懂

2020-12-08 12:05:24 综合报道 阅读:
关注AI的同学一定都知道神经网络,这是AI算法中模拟人的大脑所衍生出来的学科和算法。可以说,不了解神经网络就不能说动算法,懂算法者必懂神经网络。下面我们就对神经网络的工作原理进行深入浅出的介绍。

关注AI的同学一定都知道神经网络,这是AI算法中模拟人的大脑所衍生出来的学科和算法。可以说,不了解神经网络就不能说动算法,懂算法者必懂神经网络。下面我们就对神经网络的工作原理进行深入浅出的介绍。lcdednc

一文了解神经网络工作原理lcdednc

深度学习是机器学习中重要分支之一。它的目的是教会计算机做那些对于人类来说相当自然的事情。深度学习也是无人驾驶汽车背后的一项关键性技术,可以帮无人车识别停车标志、区分行人与路灯柱。它是手机、平板、电视和免提扬声器等设备实现语音控制的关键。深度学习近期以其前所未有的成果获得了广泛关注。lcdednc

在深度学习中,计算机模型直接从图像、文本或声音中学习直接如何执行分类任务。深度学习模型可以达到最高的准确度,有时甚至超过了人类的水平。我们通常使用大量标记的数据和包含许多层的神经网络体系结构来训练模型。lcdednc

一文了解神经网络工作原理lcdednc

 lcdednc

深度学习的模型可应用到各种复杂任务中:lcdednc

1. 人工神经网络(ANN)进行回归和分类lcdednc

2. 用于计算机视觉的卷积神经网络(CNN)lcdednc

3. 递归神经网络(RNN)用于时间序列分析lcdednc

4. 自组织地图以进行特征提取lcdednc

5. 推荐系统的深玻尔兹曼机lcdednc

6. 推荐系统的自动编码器lcdednc

在本文中,我们将尽可能的介绍人工神经网络(ANN)的所有相关内容。lcdednc

“人工神经网络(ANN)是一种信息处理范例,它受到生物神经系统(大脑)信息处理方式的启发。由大量高度互连的处理元件(神经元)组成,这些元件协同工作以解决特定问题。”lcdednc

 lcdednc

主要内容:lcdednc

1. 神经元lcdednc

2. 激活功能lcdednc

3. 激活功能的类型lcdednc

4. 神经网络如何工作lcdednc

5. 神经网络如何学习(反向传播)lcdednc

6. 梯度下降lcdednc

7. 随机梯度下降lcdednc

8. 随机梯度下降训练神经网络lcdednc

神经元lcdednc

神经元(也称为神经细胞)是大脑和神经系统的基本单元,通过树突接收来自外部世界的刺激信息,对该信息进行处理后,通过轴突输出给其他细胞。lcdednc

一文了解神经网络工作原理lcdednc

 lcdednc

生物神经元lcdednc

细胞体(Soma):神经元细胞的主要部分,包含细胞核,进行必要的生化反应。lcdednc

树突:神经元周围类似头发的管状结构。主要负责接受输入信号。lcdednc

轴突:这是一种细长的管状结构,类似于传输线。lcdednc

突触:神经元以复杂的空间排列相互连接。轴突末端再次分支,是一种高度复杂、高度专一的结构,我们称之为突触。两个神经元之间的联系就发生在这些突触处。lcdednc

树突接收其他神经元信息输入。细胞体处理这些传入信息,得到相应的输出结果,该结果通过轴突和突触发送到其他神经元。lcdednc

一文了解神经网络工作原理lcdednc

电信号流过神经元。lcdednc

下图代表了受生物神经元启发的ANN一般模型。它也被称为感知器。lcdednc

单层神经网络一般称为感知器,给定输入它将计算得到输出。lcdednc

一文了解神经网络工作原理lcdednc

感知器lcdednc

在上图中,x0, x1, x2, x3...x(n)代表该网络的输入(独立变量),每一个输入在经过所谓的树突时都要乘以相应的权重。该权重表示为w0, w1, w2, w3….w(n),它显示特定节点的强度。b是偏差值。偏差值可以向上或向下移动激活函数。lcdednc

最简单的情况,将这些乘积相加并输入传递函数(激活函数)得到结果,然后将该结果作为输出发送。lcdednc

激活函数lcdednc

激活函数对于ANN学习和理解真正复杂的东西很重要。它们的主要目的是将ANN中节点的输入信号转换为输出信号,此输出信号将作为下一层的输入。lcdednc

激活函数通过计算加权总和偏差值来决定是否激活该神经元。目的是引入非线性。lcdednc

如果我们不应用激活函数,那么输出信号将仅仅是线性函数(一阶多项式)。线性函数很容易求解,功耗也相对较小,但是它们的复杂性受到一定的限制。因此没有激活函数,我们的模型就无法进行学习,也无法对复杂的数据进行建模,例如图像,视频,音频,语音等。lcdednc

为什么我们需要非线性函数?lcdednc

非线性函数是一种具有曲率的函数。现在我们需要神经网络能够进行学习,能够表示将输入映射到输出的任意复杂函数。因此神经网络也被认为是 “通用函数逼近器”。lcdednc

激活函数的类型:lcdednc

1. 阈值激活函数—(二进制阶跃函数)lcdednc

二进制阶跃函数是基于阈值的激活函数。如果输入值高于某个阈值,则神经元被激活并将完全相同的信号发送到下一层;低于某个阈值则不被激活。lcdednc

一文了解神经网络工作原理lcdednc

二进制函数lcdednc

此函数的问题是创建一个二进制分类器(1或0),但是如果我们要连接多个这样的神经元以引入更多类,如Class1、Class2、Class3等。在这种情况下,所有神经元都将给出1 ,我们将无法进行判断。lcdednc

2. Sigmoid激活函数-(逻辑函数)lcdednc

Sigmoid函数是一种数学函数,具有特征性的“ S”形曲线或S型曲线,范围在0到1之间,因此它用于需要预测概率为输出。lcdednc

一文了解神经网络工作原理lcdednc

Sigmoid曲线lcdednc

Sigmoid函数是可微的,这意味着我们可以求解任意2个点的曲线斜率。Sigmoid激活函数的缺点是,如果提供较大的负输入,则可能导致神经网络在训练时卡住。lcdednc

3. 双曲正切函数—(tanh)lcdednc

类似于Sigmoid,但性能更好。它本质上是非线性的,因此我们可以对各层进行叠加。该函数的范围是(-1,1)。lcdednc

一文了解神经网络工作原理lcdednc

双曲正切函数lcdednc

此功能的主要优点是,负输入映射为负输出,而只有零值输入会被映射为接近零输出。因此,在训练过程中卡顿的可能性较小。lcdednc

4. 整流线性单元-(ReLu)lcdednc

ReLu是CNN和ANN中最常用的激活函数,范围从零到无穷大。[0,∞]lcdednc

一文了解神经网络工作原理lcdednc

ReLulcdednc

如果x为正,则给出输出为“ x”;如果x为负,否则输出为0。ReLu看起来是线性函数的问题,但本质上是非线性的,并且ReLu的组合也是非线性的。实际上,它是一个很好的近似器,可以通过组合Relu来近似大部分函数。lcdednc

它一般应用于神经网络的隐藏层。对于输出层而言,分类问题通常使用softmax函数,回归问题使用线性函数。lcdednc

这里存在的一个问题是,某些梯度在训练过程中可能会消失。这会导致权重更新,任何数据点都无法激活该神经元。ReLu基本导致了神经元的死亡。lcdednc

为了解决这一问题,引入了Leaky ReLu。Leaky ReLu引入了一个小斜率来保证不出现上述问题。Leaky ReLu范围从-∞到+∞。lcdednc

一文了解神经网络工作原理lcdednc

ReLu vs Leaky ReLulcdednc

Leaky增加了ReLu函数的输出范围。通常,a = 0.01。当a不为0.01时,则称为随机ReLu。lcdednc

神经网络如何工作?lcdednc

让我们以房地产价格为例,首先,我们将不同的因素汇总到一行数据中: Area, Bedrooms, Distance to city and Age.lcdednc

一文了解神经网络工作原理lcdednc

输入值通过加权的突触直接到达输出层。四个输入值均会被分析并输入到激活函数中,产生输出结果。lcdednc

这很简单,但是通过在输入和输出层之间添加一个隐藏层可以扩大神经网络的功能并提高其准确性。lcdednc

一文了解神经网络工作原理lcdednc

具有隐藏层的神经网络(仅显示非0值)lcdednc

现在在上图中,所有4个变量都通过突触连接到神经元。但是,并非所有的突触都被加权。权值包括0值和非0值。在这里,非零值表示重要性,0值表示输入被丢弃。lcdednc

让我们以第一个神经元的Area和Distance to City为非零的示例为例,这意味着它们对第一个神经元重要。另外两个变量,Bedrooms而Age权值为0,因此不通过第一神经元。lcdednc

您可能想知道为什么第一个神经元只考虑四个变量中的两个。距离城市越远房子变得越便宜,这在房地产市场上很普遍。因此,这个神经元所做的事情可能是寻找离市区较近的房屋。lcdednc

神经元很多,每个神经元用这些变量的不同组合进行相似的计算。一旦满足标准,神经元就会使用激活函数进行计算。lcdednc

下一个神经元加权的突触可能是Distance to the city和Bedrooms。因此神经元以非常灵活的方式工作,全面的搜索以查找特定的事物。lcdednc

神经网络如何学习?lcdednc

让我们先来做一个类比。神经网络的学习与我们正常的学习方式密切相关,我们首先完成一定的工作,并得到教练的纠正,下一次以更好的方式来完成这个工作。类似地,神经网络需要培训者,来描述该网络对输入做出的反应。用实际值和预测值之间的差异,计算一个误差值(也称为成本函数),并将其发送回系统。lcdednc

成本函数:实际值与输出值之间平方差的一半。lcdednc

对于网络的每一层,都会分析成本函数,并用其调整下一个输入的阈值和权重。我们的目标是使成本函数最小化。成本函数越低,实际值就越接近于预测值。这样随着网络的不断学习,每次运行的误差都减小。lcdednc

我们通过整个神经网络反馈结果数据。将输入变量连接到神经元的加权突触是我们唯一可以控制的事情,因此只要实际值和预测值之间存在差异,我们就需要调整权重。一旦稍微调整它们并再次运行神经网络,便会产生一个新的成本函数,我们希望它可以比上一个小。重复此过程,直到将成本函数降低到尽可能小的水平为止。lcdednc

一文了解神经网络工作原理lcdednc

上述过程称为反向传播,并通过网络连续进行,直到将误差值保持在最小值为止。一文了解神经网络工作原理lcdednc

反向传播lcdednc

调整权重的方法有两种:lcdednc
1.蛮力方法lcdednc
2.批梯度下降lcdednc

蛮力法lcdednc

适合单层前馈网络。在这里,我们需要考虑许多可能的权重。在这种方法中,我们想要舍弃除U形曲线底部权值以外的所有其他权重。最佳权值可以使用简单的消除技术找到。如果我们只需要优化一个权重,那么这种方法很有效。但如果是具有许多权重的复杂神经网络,该方法将因维数太高而无法实现lcdednc

分批梯度下降lcdednc

它是一阶迭代优化算法,在训练具有不同权重模型的过程中找到最小成本值(损失)。lcdednc

一文了解神经网络工作原理lcdednc

梯度下降lcdednc

在“梯度下降”过程中,我们不会一次都查看每个权重并剔除错误的权重,而是查看函数斜率。lcdednc

如果斜率→负值,则表示您沿着曲线下降。lcdednc
如果斜率→正,则不执行任何操作lcdednc

这样,可以消除大量不正确的权重。lcdednc

随机梯度下降(SGD)lcdednc

如上图所示,当我们具有凸曲线时,渐变下降效果很好。但是,如果我们没有凸曲线,则渐变下降将失败。lcdednc

“ 随机 ” 一词是指与随机概率相关的系统或过程。因此,在随机梯度下降中,随机选择一些样本,而不是每次迭代的整个数据集。lcdednc

一文了解神经网络工作原理lcdednc

随机梯度下降lcdednc

在SGD中,我们一次获取一行数据,通过神经网络运行该数据,然后调整权重。对于第二行,我们运行它,然后比较Cost函数,然后再次调整权重。lcdednc

SGD帮助我们避免了局部极小值的问题。它比Gradient Descent快得多,因为它一次运行每一行,并且不必将整个数据加载到内存中即可进行计算。lcdednc

要注意的一件事是,由于SGD通常比典型的Gradient Descent噪声更大,因此由于其下降的随机性,通常需要更多的迭代次数才能达到最小值。尽管与典型的Gradient Descent相比,它需要更多的迭代次数才能达到最小值,但在计算消耗上仍比典型的Gradient Descent少得多。因此,在大多数情况下,SGD优于分批梯度下降。lcdednc

利用随机梯度下降训练神经网络lcdednc

步骤1→将权重随机初始化为接近0但不为0的小数。lcdednc

步骤2→在输入层中输入数据集的第一个观测值,每个要素放在一个节点中。lcdednc

步骤3→ 正向传播:从左到右,神经元按顺序被激活,直到获得预测值。每个神经元的影响都受权重的限制。lcdednc

步骤4→将预测结果与实际结果进行比较,并测量的误差(成本函数)。lcdednc

步骤5→ 反向传播:从右到左,误差反向传播。根据它们对错误造成的影响来更新权重。学习率决定了我们更新权重的程度。lcdednc

步骤6→重复步骤1至5,并在每次比较后更新权重(强化学习)lcdednc

步骤7→当整个训练集通过ANN时,就完成了。lcdednc

 lcdednc

结语lcdednc

一文了解神经网络工作原理神经网络是一个全新的新概念,它还有很大潜力。可以应用于各种不同的概念中,并在测试阶段通过特定的反向传播和纠错机制进行学习。这些多层系统也许可以有一天仅靠学习来减少发生错误的可能性,而无需人工纠正。lcdednc

责编:Challeylcdednc

更多关于AI、算法方面的技术交流可以加责编微信(同名)。lcdednc

  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 因眼睛小车主被辅助驾驶误判“开车睡觉”,小鹏、蔚来回 昨日,汽车博主@常岩CY 发博称自己突然上了热搜,原来就是因自己眼睛小被小鹏汽车自动驾驶误判“开车睡觉”,不住的发出提醒。此外,@常岩CY 称在多款车型上都收到此困扰。无论是红外还是摄像头,只要开始检测眼睛,就会判定过度疲劳。小鹏P7会提示他睡觉,蔚来ET7一开车就认为其疲劳和走神,岚图FREE会在冬天为了让其“别困”而打开冷风……
  • “智能家居”未来将可通过呼吸控制操作 凯斯西储大学的研究人员创造了一个简单的原型设备,使用户能够通过改变他们的呼吸模式来控制“智能家居”。这种自供电装置可放入鼻孔,并有可能提高行动不便或无法清晰说话的人的生活质量。如果个人呼吸困难,它也可以编程为医务人员提供自动警报。
  • 一个AI程序就可将手机电池增加30% 一项尖端的人工智能开发可以将智能手机的电池寿命延长 30%。这项应用则是利用 AI 分析正在使用的应用程序的 FPS 变化,并试图找到 CPU 和 GPU 处理器的最佳运行频率以适应变化,同时消耗设备中最少的功率和温度增益……
  • AI视觉芯片如何赋能两轮车出行? 6月29日,在由全球领先的专业电子机构媒体AspenCore和深圳市新一代信息通信产业集群联合主办的“2022国际AIoT生态发展大会-智慧两轮车分论坛”中,嘉楠科技副总裁汤炜伟以《勘智AI视觉芯,赋能智眼两轮行》为主题,向大家分享了嘉楠地芯片设计创新历程,及其RISCV架构AI芯片技术路线图,并以具体案例展示AI视觉芯片如何赋能两轮车出行。
  • 碎片化、成本高是难题,AIoT行业需要哪些改变? 作为AIoT的行业基石,物联网市场到2022年预计将达到 144 亿活跃连接。随着供应限制的缓解和增长的进一步加速,IoT Analytics 最新预测指出,到2025年全球将有大约 270 亿台联网物联网设备。中国物联网链接到2025年也将达到80亿。随着整个AIoT和IoT市场的快速成长与变化,我们将面临哪些风险和挑战?
  • 英特尔张宇:边缘AI有三个阶段,我们还处在山脚 在AspenCore举办的“2022国际AIoT生态发展大会”上,英特尔公司高级首席工程师、物联网事业部中国区首席技术官张宇博士通过视频方式分享了“边缘AI技术发展趋势与展望”主题演讲。
  • 世界上尺寸最大的芯片Wafer Scale Engine-2打破了在单 Cerebras公司售价数百万美元的“全球最大AI芯片”Wafer Scale Engine-2又有新消息,在基于单个Wafer Scale Engine-2芯片的CS-2系统上训练了世界上最大的拥有200亿参数的NLP(自然语言处理)人工智能模型。
  • 婴儿或可帮助解锁下一代人工智能 都柏林圣三一学院的神经科学家及其同事刚刚发布了改进人工智能的新指导原则,他们表示,婴儿可以帮助解锁下一代人工智能(AI)。
  • 日本要利用机器学习实现半导体研究自动化 新型薄半导体材料的开发需要对大量反射高能电子衍射(RHEED)数据进行定量分析,既耗时又需要专业知识。为了解决这个问题,东京理科大学的科学家们确定了可以帮助自动化 RHEED 数据分析的机器学习技术。他们的发现可以极大地加速半导体研究,并为更快、更节能的电子设备铺平道路。
  • 纯视觉自动驾驶更安全?美国交通部发布数据打脸特斯拉 特斯拉的纯视觉自动驾驶到底效果如何?真的如马斯克所说的:“通过摄像头和计算机网络让自动驾驶比人类驾驶更安全”吗?近日美国国家公路交通安全管理局发布了一份新的数据,颇有打脸特斯拉的意味。
  • 每秒可对近20亿张图像进行处理分类的“超级芯片” 在测试过程中,该团队制作了一个尺寸为 9.3 mm 2(0.01 in 2)的芯片,并将其用于对一系列类似于字母的手写字符进行分类。在对相关数据集进行训练后,该芯片能够对包含两种字符集的图像进行分类,准确率达到 93.8%,对四种类型的图像进行分类准确率为 89.8%。
  • 人工智能的创新发明,专利权属于谁? 随着人工智能技术的发展进步,近几年出现了许多涉及人工智能的发明,如2020 年,机器学习算法帮助研究人员开发了一种对多种病原体有效的抗生素(参见Nature),此外,人工智能 (AI) 也被用于帮助疫苗开发、药物设计、材料发现、空间技术和船舶设计。那么这些由人工智能发明的技术,专利到底归属于谁呢?
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了