如何在MCU上快速部署TinyML-EDN 电子技术设计

 你对人工智能(AI)和机器学习(ML)感到好奇吗？你想知道如何在你已经使用过的MCU上使用它吗？在本文中，我们将向你介绍MCU上的机器学习。本主题也称为微型机器学习(TinyML)。请准备好在剪刀石头布游戏中输给ESP-EYE开发板。你将了解数据收集和处理、如何设计和训练AI以及如何让它在MCU上运行。此示例为你提供了从头到尾完成你自己的TinyML项目所需的一切。

你对人工智能(AI)和机器学习(ML)感到好奇吗？你想知道如何在你已经使用过的MCU上使用它吗？在本文中，我们将向你介绍MCU上的机器学习。本主题也称为微型机器学习(TinyML)。请准备好在剪刀石头布游戏中输给ESP-EYE开发板。你将了解数据收集和处理、如何设计和训练AI以及如何让它在MCU上运行。此示例为你提供了从头到尾完成你自己的TinyML项目所需的一切。5MYednc

我为什么要关心TinyML？

你肯定听说过DeepMind和OpenAI等科技公司。他们凭借专家和GPU能力在ML领域占据主导地位。为了给人一种规模感，最好的人工智能，比如谷歌翻译所使用的人工智能，需要进行数月的训练。他们并行使用数百个高性能GPU。TinyML通过变小来稍微扭转局面。由于内存限制，大型AI模型不适合MCU。下图显示了硬件要求之间的差异。5MYednc

5MYednc

与在云中使用AI服务相比，MCU上的ML有哪些优势？我们发现了七个主要优势：5MYednc

成本：MCU的购买和运行成本低廉。
环境友好：在MCU上运行人工智能消耗的能量很少。
集成：MCU很容易集成到现有环境中，例如生产线。
隐私和安全：数据可以在设备上本地处理。数据不必通过互联网发送。
快速原型开发：TinyML使你能够在短时间内开发概念验证解决方案。
自主可靠：微型设备可以在任何地方使用，即使没有基础设施。
实时：数据在MCU上处理，没有延迟。唯一的限制是MCU的处理速度。

石头剪刀布

5MYednc

你有没有在与AI的石头剪刀布中输过？或者你想通过打败人工智能来打动你的朋友吗？你将使用TinyML对抗ESP-EYE开发板。要使这样的项目成为可能，你需要学习五个步骤。以下部分提供了必要步骤的高级概述。如果你想仔细查看，请参阅我们的项目存储库中的文档。它解释了实用的细节。5MYednc

收集数据

收集数据是ML的重要组成部分。为了让事情运行起来，你需要拍摄用你的手形成石头剪刀布手势的图像。图片越独特越好。AI将了解到你的手会处于不同的角度、位置或光线变化。数据集包含了所记录的图像和每个图像的标签。这被称为监督学习。5MYednc

最好使用与训练人工智能相同的传感器和环境来运行人工智能。这样能确保模型熟悉所传入的数据。例如，由于制造差异，温度传感器对于相同的温度具有不同的电压输出。就我们的目的而言，这意味着使用ESP-EYE摄像头在统一背景上录制图像是理想的。在部署期间，人工智能将在类似的背景下发挥最佳作用。还可以使用网络摄像头录制图像，但可能会牺牲一些准确性。由于MCU容量有限，我们将记录和处理96×96像素的灰度图像。5MYednc

收集数据后，将数据分成训练集和测试集很重要。我们这样做是为了了解我们的模型如何识别以前从未见过的手势图像。该模型自然会对训练期间已看到的图像表现良好。5MYednc

5MYednc

这里有一些示例图像。如果你现在不想收集数据，可以在这里下载我们现成的数据集。5MYednc

预处理数据

识别数据中的模式不仅仅对人类来说很困难。为了让AI模型更容易做到这一点，通常依赖预处理算法。在我们的数据集中，我们使用ESP-EYE和网络摄像头记录图像。由于ESP-EYE可以捕获96×96分辨率的灰度图像，因此我们在这里不需要做太多进一步的处理。然而，我们需要将网络摄像头图像缩小并裁剪为96×96像素，并将它们从RGB格式转换为灰度格式。最后，我们要标准化所有图像。下图可以看到我们所处理的中间步骤。5MYednc

5MYednc

设计模型

设计模型非常棘手！详细的处理超出了本文的范围。我们将描述模型的基本组件以及如何设计我们的模型。在幕后，我们的AI依赖于神经网络。可以将神经网络视为神经元的集合，这有点像我们的大脑。这就是为什么在僵尸末日的情况下，AI也会被僵尸吃掉。5MYednc

当网络中的所有神经元都相互连接时，这称为完全连接或密集。可以认为这是最基本的神经网络类型。由于我们希望我们的AI能够从图像中识别手势，因此我们使用了更高级更适合图像的卷积神经网络(CNN)。卷积降低了图像的维数，提取了重要的模式并保留了像素之间的局部关系。为了设计模型，我们使用了TensorFlow库，它提供了现成的神经网络组件，称为层，可以轻松创建神经网络！5MYednc

创建模型意味着堆叠层。它们的正确组合对于开发鲁棒且高精度的模型至关重要。下图显示了我们正在使用的不同层。Conv2D代表一个卷积层。BatchNormalization层对上一层的输出应用了一种标准化形式。然后我们将数据送入激活层，这会引入非线性并过滤掉不重要的数据点。接下来，最大池化类似于卷积来减小图像的大小。这个层块重复几次，合适的数量由经验和实验所决定。之后，我们使用扁平化层将二维图像缩减为一维数组。最后，该数组与代表石头剪刀布类的三个神经元紧密相连。5MYednc

def make_model_simple_cnn(INPUT_IMG_SHAPE, num_classes=3):5MYednc

    inputs = keras.Input(shape=INPUT_IMG_SHAPE)5MYednc

    x = inputs5MYednc

    x = layers.Rescaling(1.0 / 255)(x)5MYednc

    x = layers.Conv2D(16, 3, strides=3, padding="same")(x)5MYednc

    x = layers.BatchNormalization()(x)5MYednc

    x = layers.Activation("relu")(x)5MYednc

    x = layers.MaxPooling2D()(x)5MYednc

    x = layers.Conv2D(32, 3, strides=2, padding="same", activation="relu")(x)5MYednc

    x = layers.MaxPooling2D()(x)5MYednc

    x = layers.Conv2D(64, 3, padding="same", activation="relu")(x)5MYednc

    x = layers.MaxPooling2D()(x)5MYednc

    x = layers.Flatten()(x)5MYednc

    x = layers.Dropout(0.5)(x)5MYednc

    outputs = layers.Dense(units=num_classes, activation="softmax")(x)5MYednc

    return keras.Model(inputs, outputs)5MYednc

训练模型

一旦我们设计了一个模型，就可以训练它了。最初，AI模型将进行随机预测。预测是与标签相关的概率，在我们的例子中是石头、剪刀或布。我们的AI会告诉我们它认为一张图像是每个标签的可能性有多大。因为人工智能一开始就在猜测标签，所以它经常会把标签弄错。训练是在将预测标签与真实标签进行比较后进行的。预测误差会导致网络中神经元之间的更新。这种学习形式称为梯度下降。因为我们的模型是在TensorFlow中所构建的，所以训练就像一、二、三一样简单。下面，可以看到训练期间所产生的输出——准确性（训练集）和验证准确性（测试集）越高越好！5MYednc

Epoch 1/65MYednc

480/480 [==============================] - 17s 34ms/step - loss: 0.4738 - accuracy: 0.6579 - val_loss: 0.3744 - val_accuracy: 0.87185MYednc

Epoch 2/65MYednc

216/480 [============>.................] - ETA: 7s - loss: 0.2753 - accuracy: 0.84365MYednc

在训练过程中，可能会出现多种问题。最常见的问题是过度拟合。随着模型一遍又一遍地接触相同的例子，它会开始记住训练数据，而不是学习潜在的模式。当然，我们从学校就记得理解胜于记忆！在某些时候，训练数据的准确性可能会继续上升，而测试集的准确性则不会。这是过度拟合的明显指标。5MYednc

转换模型

经过训练，我们得到了一个TensorFlow格式的AI模型。由于ESP-EYE无法解释这种格式，我们将模型更改为微处理器可读格式。我们从转换为TfLite模型开始。TfLite是一种更紧凑的TensorFlow格式，它使用量化来减小模型的大小。TfLite通常用于世界各地的边缘设备，例如智能手机或平板电脑。最后一步是将TfLite模型转换为C数组，因为MCU无法直接解释TfLite。5MYednc

部署模型

现在可以将我们的模型部署到微处理器上了。我们唯一需要做的就是将新的C数组放入预期的文件中。替换C数组的内容，不要忘记替换文件末尾的数组长度变量。我们提供了一个脚本来简化此过程。5MYednc

嵌入式环境

让我们回顾一下MCU上所发生的事情。在设置过程中，将解释器配置为我们图像的形状。5MYednc

// initialize interpreter5MYednc

static tflite::MicroInterpreter static_interpreter(5MYednc

    model, resolver, tensor_arena, kTensorArenaSize, error_reporter);5MYednc

interpreter = &static_interpreter;5MYednc

model_input = interpreter->input(0);5MYednc

model_output = interpreter->output(0);5MYednc

// assert real input matches expect input5MYednc

if ((model_input->dims->size != 4) || // tensor of shape (1, 96, 96, 1) has dim 45MYednc

    (model_input->dims->data[0] != 1) || // 1 img per batch5MYednc

    (model_input->dims->data[1] != 96) || // 96 x pixels5MYednc

    (model_input->dims->data[2] != 96) || // 96 y pixels5MYednc

    (model_input->dims->data[3] != 1) || // 1 channel (grayscale)5MYednc

    (model_input->type != kTfLiteFloat32)) { // type of a single data point, here a pixel5MYednc

        error_reporter->Report("Bad input tensor parameters in model\n");5MYednc

        return;5MYednc

}5MYednc

设置完成后，将捕获的图像发送到模型，然后做出有关手势的预测。5MYednc

// read image from camera into a 1-dimensional array5MYednc

uint8_t img[dim1*dim2*dim3]5MYednc

if (kTfLiteOk != GetImage(error_reporter, dim1, dim2, dim3, img)) {5MYednc

TF_LITE_REPORT_ERROR(error_reporter, "Image capture failed.");5MYednc

}5MYednc

// write image to model5MYednc

std::vector<uint8_t> img_vec(img, img + dim1*dim2*dim3);5MYednc

std::vector<float_t> img_float(img_vec.begin(), img_vec.end());5MYednc

std::copy(img_float.begin(), img_float.end(), model_input->data.f);5MYednc

// apply inference5MYednc

TfLiteStatus invoke_status = interpreter->Invoke();5MYednc

}5MYednc

然后模型会返回每个手势的概率。由于概率数组只是一系列介于0和1之间的值，因此需要进行一些解释。我们认为识别出的手势是概率最高的手势。现在我们通过将识别的手势与AI的动作进行比较来处理解释，并确定谁赢得了这一轮。你没有机会！5MYednc

// probability for each class5MYednc

float paper = model_output->data.f[0];5MYednc

float rock = model_output->data.f[1];5MYednc

float scissors = model_output->data.f[2];5MYednc

下图说明了MCU上的步骤。出于我们的目的，不需要对MCU进行预处理。5MYednc

5MYednc

展开示例

挑战一下怎么样？想要实现新的人生目标？或是给老朋友留下深刻印象或找到新朋友？通过添加蜥蜴和斯波克，可以让石头剪刀布更上一层楼。你的AI朋友将是一项更接近世界霸权的技能。首先你应该看看我们的石头剪刀布知识库，并能够复制上述步骤。README自述文件可帮助你了解详细信息。下图向你展示了游戏的运作方式。你需要添加两个额外的手势和一些新的输赢条件。5MYednc

5MYednc

开始你自己的项目

如果你喜欢这篇文章并想开始你自己的项目，我们会为你提供一个模板项目，它使用了与我们的剪刀石头布项目相同的简单流水线。你可以在此处找到该模板。不要犹豫，通过社交媒体向我们展示你的项目。我们很想知道你能创造什么！5MYednc

你可以在和找到有关TinyML的更多信息。Pete Warden的书是一个很好的资源。5MYednc

5MYednc

Nikolas Rieder是汉堡应用科学大学的学生。他在攻读机电一体化学士学位，并自2022年2月起在Itemis AG进行强制实习。他与TinyML领域的合著者一起工作，将他对AI的热情与他在嵌入式系统方面的专业知识相结合。Nikolas是一个终身学习者，他对改善日常生活的未来技术充满好奇。5MYednc

（原文刊登于EDN姊妹网站Embedded，参考链接：How to quickly deploy TinyML on MCUs，由Franklin Zhao编译。）5MYednc

责编：Franklin

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

上一篇： NOR闪存如何帮助克服可穿戴设备的设计挑战 下一篇： 中国存储标准化,《存储产业标准化白皮书(2022)》发布

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

毫米波雷达与音频技术重塑汽车驾乘新体验汽车行业的发展正由两大创新领域主导：更为精准可靠的车内感知系统和高质量音频系统。传统方法如增加传感器或音频设备数量，虽可提升性能但会带来成本上升和复杂性增加的问题。
新一代MCU向着边缘AI和实时控制发展在工业和汽车领域，电机驱动和数字电源转换是典型的实时控制系统，要求处理器具有高实时性和强大的数学计算与处理能力。这些应用需要优质的ADC和PWM功能，并通过联动机制，形成高效、有机的实时控制系统。
兆易创新推出GD32G5系列Cortex®-M33内核高性能MCU，全业界领先的半导体器件供应商兆易创新GigaDevice（股票代码 603986）宣布，正式推出基于Arm® Cortex®-M33内核的GD32G5系列高性能微控制器···
瑞萨推出全新RA8入门级MCU产品群，提供极具性价比的高性 RA8E1与RA8E2提供理想的标量和矢量计算性能以及同类卓越的功能集，满足价值导向型市场需求···
强劲升级，兆易创新GD32A7系列全新一代车规级MCU震撼登 GD32A71x/GD32A72x/GD32A74x系列车规级MCU采用了超高性能ARM® Cortex®-M7内核，分别支持单核、双核、单核锁步三种选项，主频160MHz，算力高达763 DMIPS，并配备了最高4MB片上Flash和512KB SRAM，支持双Flash BANK，可满足无缝OTA升级需求···
借助 AMD Kria SOM 通过混合方式实现分布式计算分布式计算的混合方法可以通过在边缘端使用可扩展、高效且低功耗的自适应计算平台来实现，这种平台可以无缝连接到云端以传输双向数据···
Ceva 低功耗蓝牙和 802.15.4 IP 为 Alif Semiconducto Balletto 低功耗蓝牙5.3 和 Matter 无线微控制器系列带有神经协处理器，适用于无线音频和智能家居的人工智能/机器学习工作负载···
Microchip推出12款无线新产品，为不同技术水平的设计人新产品加入了同类产品中唯一的蓝牙低功耗产品系列模块、片上系统（SoC）产品和即插即用选项···
大联大品佳集团推出基于Infineon产品的汽车热管理方案与传统燃油车相比，新能源汽车对于热管理系统的要求更为复杂和苛刻。电动车和混合动力车不仅需要管理发动机的温度，还需确保电池组、电动机和电力电子设备处于最佳温度范围，以保持性能并延长使用寿命。在此背景下，大联大品佳基于Infineon Aurix TC334 MCU推出汽车热管理方案，可实时监测并管理汽车零部件的温度变化，使之始终保持在合适的温度范围内。
Microchip推出搭载硬件安全模块的PIC32CK 32位单片机这款全新的中端MCU系列为设计人员提供了更高水平的安全性和灵活性···
FPGA助力高速未来 FPGA提供无与伦比的灵活性、安全性和高性能，可处理各类复杂任务，包括管理超级高铁网络中的推进、导航和通信等。
意法半导体突破20纳米技术节点，提升新一代微控制器的成首款采用新技术的 STM32 微控制器将于 2024 下半年开始向部分客户出样片，18nm FD-SOI制造工艺与嵌入式相变存储器(ePCM)组合，实现性能和功耗双飞跃……

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

如何在MCU上快速部署TinyML

我为什么要关心TinyML？

石头剪刀布

收集数据

预处理数据

设计模型

训练模型

转换模型

部署模型

嵌入式环境

展开示例

开始你自己的项目