国内首个类ChatGPT模型MOSS内测，中国版ChatGPT还差什么？-EDN 电子技术设计

 2月20日，复旦大学自然语言处理实验室邱锡鹏教授团队发布国内首个类ChatGPT模型MOSS（https://moss.fastnlp.top/），现已发布至公开平台，邀公众参与内测。

2月20日，复旦大学自然语言处理实验室邱锡鹏教授团队发布国内首个类ChatGPT模型MOSS（https://moss.fastnlp.top/），现已发布至公开平台，邀公众参与内测。F8Oednc

F8Oednc

ChatGPT发布以来，基于指令学习技术的类ChatGPT模型在我国能否开发成功，成为业界关注的一个焦点。MOSS和ChatGPT一样，开发的过程也包括自然语言模型的基座训练、理解人类意图的对话能力训练两个阶段。不同之处在于，复旦团队采用了不同的技术路线，通过让MOSS和人类以及其他对话模型都进行交互，显著提升了学习效率和研发效率，短时间内就高效完成了对话能力训练。F8Oednc

F8Oednc

不过很可惜受限于实验室的规模，加之复旦大学团队开发的这个对话式大型语言模型的名字刚好和《流浪地球》系列电影中的人工智能MOSS重名，引发了网友们的广泛关注，当晚由于瞬时访问压力过大，MOSS服务器被网友挤崩。F8Oednc

2月21日，MOSS官网发布公告称，MOSS还是一个非常不成熟的模型，距离ChatGPT还有很长的路需要走。该团队表示，我们一个学术研究的实验室无法做出和ChatGPT能力相近的模型，MOSS只是想在百亿规模参数上探索和验证ChatGPT的技术路线，并且实现各种对话能力。最初的想法只是将MOSS进行内测，以便进一步优化，没想到会引起这么大关注，我们的计算资源不足以支持如此大的访问量，并且作为学术团队也没有相关工程经验，给大家造成非常不好的体验和第一印象，在此向大家致以真诚的歉意。F8Oednc

F8Oednc

那么如果我国想运营一个像ChatGPT一样规模的模型需要多少资源呢？根据Similarweb的数据，23年1月份ChatGPT日活约1300万人，每人平均1000字左右的问题，因此合计产生约130亿字（173.3亿个token），假设24小时平均分配任务，需要的A100 GPU数量为173.3亿*2*3000亿/（20%*24小时*3600秒）=601.75 PetaFLOP/S，由于访问流量存在峰值，假定访问峰值是一天均值的5倍，因此共需要602台DGX A100服务器才能够满足当前的访问量。根据海通证券的估计，运营阶段ChatGPT年GPU/CPU需求空间分别在7000万美元及778万美元。而且这还只是根据当前数据估计的运营成本，据了解，当前ChatGPT模型无法访问外部知识，仅依靠模型参数进行计算；如果将ChatGPT与搜索功能结合，如Bing等搜索引擎，其对算力资源的消耗将成数倍增长，算力成本可能达到当前的百倍。F8Oednc

F8Oednc

除了硬件成本，想打造中国的ChatGPT还需要大量的优秀人才，目前我国大模型方面的积累包括有大厂的百度的文心、阿里的通义、京东的言犀、华为的盘古等，还有如智源研究院的悟道以及本次介绍的MOSS这一类由科研机构、高校和其他学术团队创造的大模型。其实我国在这些大模型的开发中已经积累了相当多的优秀人才，虽然目前我们所拥有的模型还不足以匹敌ChatGPT，但相信在全体AI从业者的努力下，我们很快就能迎来中国版的ChatGPT。F8Oednc

责编：Ricardo

阅读全文，请先

上一篇： “清华系”企业北极雄芯发布国内首款基于Chiplet架构的智能处理芯片，RISC-V CPU核心 下一篇： 中科大团队提出钙钛矿电池新结构,实现一项新世界纪录

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

为旌科技感算控一体化芯片落地，带来6倍效率提升？具身智能的本质是‘大脑（认知）+小脑（控制）+感官（感知）’的协同进化，需要芯片层面实现三者深度融合。
爱芯元智发布AX8850：让AI算力更便宜，让智能更可及爱芯元智希望把算力做得更加便宜具智价比，普惠AI，让我们的边缘智能更加触手可及···
万有引力EB100芯片亮相，空间计算走向低功耗新时代？ EB100芯片将为XR和机器人行业带来更好、更低功耗的空间计算和显示能力，开启空间计算时代的无限可能···
情境感知AI：利用FPGA技术增强边缘智能现场可编程门阵列（FPGA）的灵活性、现场升级能力和互操作性，结合其低功耗、低延迟和并行处理能力，使其成为开发者克服挑战并优化情境边缘AI应用的关键工具。
智能眼镜的困境和解法：“百镜大战”的未来在哪儿？ Ray-Ban Meta AI眼镜可能带火了整个智能眼镜市场，但智能眼镜的发展仍受到“不可能三角”的制约，有人开始做新标准，有人在做新生态......解决问题的关键会是什么？
视觉Transformer已经超越CNN：原因分析以及如何发挥它们本文将探讨ViT成为首选的原因、ViT的关键不同之处，以及要最大限度地发挥其的性能，哪些硬件功能必不可少。
释放AI潜能，Arm计算平台构建计算与存储的未来当下，我们正处在激动人心的人工智能 (AI) 技术变革初期阶段。随着自然语言、多模态大模型以及生成式 AI 技术的加速演进，AI 正以前所未有的速度重塑各行各业···
华为离职“天才少年”预告：通用具身基座大模型GO-1有何 3月10日，智元机器人正式发布了重量级新品，全球首个通用具身基座大模型——智元启元大模型GO-1···
DeepSeek锐评Manus：适合尝鲜，别太当真让我们一起看看DeepSeek这个大脑是怎么评价Manus这双手的···
人工智能时代来临：AI需要伦理吗？如今，人工智能已成为人们老生常谈的话题，因此，有必要明确什么是人工智能，是否存在伦理准则以及需要考虑的潜在风险，以便正确使用人工智能···
其实CPU才是最适合AI推理的？因为这五大理由本文将具体介绍CPU成为AI推理工作负载最佳目标的五大理由···
人工智能前沿｜2025 年影响工程的顶级趋势想要在人工智能竞赛中保持领先的工程领导者应该关注四个关键领域的进步：生成式人工智能、验证和确认、降阶模型（ROM）和控制系统设计···

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

国内首个类ChatGPT模型MOSS内测，中国版ChatGPT还差什么？