GPT-4终于上线，看看它到底有多聪明？-EDN 电子技术设计

 3月14日，ChatGPT的开发机构OpenAI正式发布其里程碑之作GPT-4。据介绍，GPT-4是一个多模态大模型（接受图像和文本输入，生成文本）。相比上一代的GPT-3，GPT-4可以更准确地解决难题，具有更广泛的常识和解决问题的能力。

3月14日，ChatGPT的开发机构OpenAI正式发布其里程碑之作GPT-4。据介绍，GPT-4是一个多模态大模型（接受图像和文本输入，生成文本）。相比上一代的GPT-3，GPT-4可以更准确地解决难题，具有更广泛的常识和解决问题的能力，能够处理超过25000个单词的文本，编写更大型的代码，允许长文内容创建、扩展对话以及文档搜索和分析等用例。此外，OpenAI还承诺GPT-4相比之前的模型，包括ChatGPT此前应用的GPT-3.5，将更加安全且具协调性。WWDednc

3月29日，Aspencore将在IIC Shanghai(2023国际集成电路展览会暨研讨会)同期举办第二届 “碳中和暨绿色能源”电子产业可持续发展高峰论坛，欢迎大家点击这里报名参会，共同探寻可持续发展新道路。WWDednc

WWDednc

无敌的考试机器

那GPT-4实际的表现到底有多强呢？简单来说光论考试已经与人类相当，甚至超过了不少普通人。根据OpenAI的评估，GPT-4已经能轻松通过美国的律师考试，且考进了前10%的排名。相比之下，它的上一代模型GPT-3.5倒数10%只能吊个车尾。WWDednc

除了律师考试，GPT-4还在美国大学入学测试SAT阅读写作中拿下710分、数学700分（满分800），虽然分数不高，但已经够上美国大学的录取水平。更重要的是，GPT-4能在大学的基础微积分课程中获得4的成绩（5分为满分），这证明了该模型已经掌握了高等数学大部分的概念。WWDednc

WWDednc

另外，GPT-4在不同语种上的能力表现：中文的准确度大概在80%左右，已经要优于GPT-3.5的英文表现了。因为许多现有的ML基准测试都是用英语编写的，为了初步了解GPT-4其他语言的能力，研究人员使用Azure翻译将MMLU基准（一套涵盖57个主题的14000个多项选择题）翻译成多种语言。在测试的 26 种语言的 24 种中，GPT-4 优于 GPT-3.5 和其他大语言模型（Chinchilla、PaLM）的英语语言性能：WWDednc

WWDednc

小编要失业了？

除了优秀的考试和语言能力，强大的识图能力和显著提高的回答准确性，以及文字输入长度限制的增加，也让GPT-4的文书处理变得更加简洁高效，大大扩展了GPT-4的实用性。有网友直接把整篇论文截图发给它，GPT-4可以按像素处理其中的文字和图片，并给出对整篇论文的总结摘要。WWDednc

WWDednc

当提供来自《纽约时报》的文章时，新的聊天机器人几乎每次都能对故事进行精确和准确的总结。如果在摘要中添加一个随机句子并询问机器人摘要是否不准确，它会指向那个被添加的句子。WWDednc

WWDednc

发布会直播上，OpenAI总裁Gregman还现场表演了一次GPT-4给代码修Bug，直接把1万字的程序文档粘贴给GPT-4，最后再附上出现的问题，就可以在几秒钟内得到解决办法。以目前GPT-4的速度来看，以后不光小编要失业，程序员也不远了。WWDednc

WWDednc

冷笑话收割机

以人类千奇百怪的笑点来说，其实大多数笑话都是很难其笑点原因的。而GPT-4的出现给爱讲冷笑话的朋友带来了福音，它已经可以轻松理解网友心照不宣的冷笑话，即便是表情包，它也能说个子丑寅卯来。比如下面的这张图，GPT-4可以按顺序描述出每一格的内容，并总结笑点：用巨大的过时VGA接口给小巧的现代智能手机充电。WWDednc

WWDednc

而除了分析笑点，GPT-4还能分析要点，它可以通过用户的简单需求直接生成代码，甚至网站。即便用户只是在餐巾纸上画了个简单界面，GPT-4都能直接搞出一个可运行的网站。WWDednc

WWDednc

仍有不足

根据OpenAI的内部测试，GPT-4仍有GPT-3.5的老毛病，就是胡言乱语。专业地讲，GPT-4仍会产生幻觉，生产错误答案，并出现推理错误。比如当被要求提供描述最新癌症研究的网站地址时，它有时会生成不存在的互联网地址。这一点也困扰着所有领先的聊天机器人，因为系统不了解什么是真什么是假，它们可能会生成完全错误的文本。WWDednc

另一方面，GPT-4仍缺乏对数据截至日期后新进展的了解能力，即其无法在训练学习后，追踪新的信息来补足对某件事认知。比如当问及NLP（自然语言处理）中需要解决的重要问题是什么？未来十年的研究？它无法提出全新的想法。此外，它也无法从经验中学习，并可能一直轻信人类。WWDednc

3月29日，Aspencore将在IIC Shanghai(2023国际集成电路展览会暨研讨会)同期举办第二届 “碳中和暨绿色能源”电子产业可持续发展高峰论坛，欢迎大家点击这里或扫码报名参会，共同探寻可持续发展新道路。WWDednc

WWDednc

责编：Ricardo

阅读全文，请先

人工智能安全与可靠性人机交互通信物联网无人机/机器人新品技术实例产业前沿历史上的今天 EDN原创

上一篇： 一种高性能半导体材料可以帮助减少热量排放 下一篇： 蓝牙传输范围须知

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

为旌科技感算控一体化芯片落地，带来6倍效率提升？具身智能的本质是‘大脑（认知）+小脑（控制）+感官（感知）’的协同进化，需要芯片层面实现三者深度融合。
爱芯元智发布AX8850：让AI算力更便宜，让智能更可及爱芯元智希望把算力做得更加便宜具智价比，普惠AI，让我们的边缘智能更加触手可及···
万有引力EB100芯片亮相，空间计算走向低功耗新时代？ EB100芯片将为XR和机器人行业带来更好、更低功耗的空间计算和显示能力，开启空间计算时代的无限可能···
情境感知AI：利用FPGA技术增强边缘智能现场可编程门阵列（FPGA）的灵活性、现场升级能力和互操作性，结合其低功耗、低延迟和并行处理能力，使其成为开发者克服挑战并优化情境边缘AI应用的关键工具。
智能眼镜的困境和解法：“百镜大战”的未来在哪儿？ Ray-Ban Meta AI眼镜可能带火了整个智能眼镜市场，但智能眼镜的发展仍受到“不可能三角”的制约，有人开始做新标准，有人在做新生态......解决问题的关键会是什么？
视觉Transformer已经超越CNN：原因分析以及如何发挥它们本文将探讨ViT成为首选的原因、ViT的关键不同之处，以及要最大限度地发挥其的性能，哪些硬件功能必不可少。
释放AI潜能，Arm计算平台构建计算与存储的未来当下，我们正处在激动人心的人工智能 (AI) 技术变革初期阶段。随着自然语言、多模态大模型以及生成式 AI 技术的加速演进，AI 正以前所未有的速度重塑各行各业···
华为离职“天才少年”预告：通用具身基座大模型GO-1有何 3月10日，智元机器人正式发布了重量级新品，全球首个通用具身基座大模型——智元启元大模型GO-1···
DeepSeek锐评Manus：适合尝鲜，别太当真让我们一起看看DeepSeek这个大脑是怎么评价Manus这双手的···
人工智能时代来临：AI需要伦理吗？如今，人工智能已成为人们老生常谈的话题，因此，有必要明确什么是人工智能，是否存在伦理准则以及需要考虑的潜在风险，以便正确使用人工智能···
其实CPU才是最适合AI推理的？因为这五大理由本文将具体介绍CPU成为AI推理工作负载最佳目标的五大理由···
人工智能前沿｜2025 年影响工程的顶级趋势想要在人工智能竞赛中保持领先的工程领导者应该关注四个关键领域的进步：生成式人工智能、验证和确认、降阶模型（ROM）和控制系统设计···

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

GPT-4终于上线，看看它到底有多聪明？

无敌的考试机器

小编要失业了？

冷笑话收割机

仍有不足