广告

复旦团队发布国内首个类ChatGPT模型MOSS,与ChatGPT相比差距如何?

2023-02-21 15:23:56 综合报道 阅读:
复旦大学自然语言处理实验室邱锡鹏教授团队悄然发布了国内首个类ChatGPT模型MOSS(https://moss.fastnlp.top/),不仅一举刷出数个微博热搜话题,在知乎上更是直接冲上热榜,话题浏览进306万次。知乎匿名网友称已经拿到了内测资格,并实时更新了一波测试结果……

据EDN电子技术设计报道,2月20日,复旦大学自然语言处理实验室邱锡鹏教授团队悄然发布了国内首个类ChatGPT模型MOSS(https://moss.fastnlp.top/),不仅一举刷出数个微博热搜话题,在知乎上更是直接冲上热榜,话题浏览进306万次。2p6ednc

2p6ednc

据EDN报道,复旦NLP团队这个类ChatGPT模型,发布即面向公众进行内测,据悉,3月份将开放源代码。(更多详情:国内首个类ChatGPT模型MOSS内测,中国版ChatGPT还差什么?2p6ednc

MOSS与ChatGPT相比差距有多大?

有知乎匿名网友称已经拿到了内测资格,并实时更新了一波测试结果:2p6ednc

1、帮我把今年的国自然写一下。杰青那种。2p6ednc

2p6ednc

2. 在我的电脑桌面上有一个名为wxc的文件夹,文件夹内有400个名字不同的mat文件,每个mat文件中都有名字为x,y,z的数据组,请你用matlab代码实现将文件夹中的mat文件里的x,y,z,数据组合并成一个csv文件2p6ednc

2p6ednc

for(i=1:length(mat文件中的名字)){name = mat文件中的名字[i];data = {name};fprintf('%s,',name);}end for2p6ednc

3. Write three poems about artificial intelligence, humans, religion, war, death, life, thought, freedom, rebellion, action, destruction2p6ednc

2p6ednc

4. Moss,请帮我写一个k-mean算法2p6ednc

2p6ednc

5. 鸡兔同笼问题 @胖蟹2p6ednc

2p6ednc

随后,EDN小编以及量子位分别向ChatGPT发出来上述提问:

2p6ednc

2p6ednc

2p6ednc

2p6ednc

2p6ednc

综合来看,MOSS的回答明显不及ChatGPT。2p6ednc

基本步骤相同,技术路线不同

据研发团队表示,MOSS开发的基本步骤与ChatGPT一样,包括自然语言模型的基座训练、理解人类意图的对话能力训练两个阶段。在对话能力训练阶段,OpenAI收集了至少几十万条人类指令,让各行各业的专业标注员写出指令回复,再将它们输入模型基座,以帮助ChatGPT逐步理解各种指令。但不同的是技术路线,复旦团队通过让MOSS和人类以及其他对话模型都进行交互,显著提升了学习效率和研发效率,短时间内就高效完成了对话能力训练。2p6ednc

邱锡鹏坦言:“MOSS与ChatGPT的差距主要在自然语言模型基座预训练这个阶段。MOSS的参数量比ChatGPT小一个数量级,在任务完成度和知识储备量上,还有很大提升空间。”2p6ednc

此外,团队表示,在这些问题里面MOSS的最大短板是中文水平不够高。主要原因是互联网上中文网页干扰信息如广告很多,清洗难度很大。为此,复旦大学自然语言处理实验室正在加紧推进中文语料的清洗工作,并将清洗后的高质量中文语料用于下一阶段模型训练。科研团队相信,这将有效提升模型的中文对话能力。2p6ednc

责编:Demi
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 具有双频控制的E类谐振升压DC/DC转换器 Power Electronics News分析了一个以E类双频信号驱动运行的DC/DC升压转换器。
  • 国产SSD主控芯片发布,让存算一体与可信计算兼得 忆芯科技高端企业级芯片及方案发布会在合肥举行。“集成电路是整个可信根的根。没有集成电路是不行的,尽管软件定义,但是一定要软硬结合,以硬件为根。”沈昌祥院士认为。
  • A17 Bionic最新基准测试曝光,多核性能比早期结果慢11%? 据称网上出现了A17 Bionic的新性能数据,显示它在多核工作负载中比之前曝光的数据慢了11%,所谓的Geekbench 6分数是由Revengus发现的,他在韩国网站DCInside上偶然发现了新的A17 Bionic数字。通过下面给出的图片,苹果的第一个3纳米SoC在单核和多核结果中获得了3,019分和7,860分,值得一提的是,此前曝光的基准测试数据单核和多核分数分别为3,986和8,841。
  • 一种高性能半导体材料可以帮助减少热量排放 研究团队创造了一种氧化物陶瓷材料,解决了长期困扰热电发电机的效率问题。这些设备可以从热能中发电,包括发电厂的热能排放,这导致了全球变暖。
  • 三星也玩“P”月亮,“空间变焦”技术被指造假 很多网友一定已经看过三星 Galaxy S23 Ultra 的视频广告了,一位女士拍摄了一张月球的详细照片——陨石坑等等,她对面的邻居握着望远镜问道:“Can you send me that?”。而这段视频,也被一位网友指认为三星“空间变焦”(Space Zoom)登月照片造假的证据。
  • AC/DC电源尺寸在继续缩小 无论AC/DC电源是开放式还是封闭式,甚至是台式适配器,用于医疗应用和工业应用的最新电源设备都有一些共同点:它们提供了更小的解决方案尺寸并实现了更高的功率密度,同时提供更高的效率。
  • 从“吸血鬼设备”中节省家庭用电 家用电器浪费了大约20%的电力。这些能源吸血鬼有可能通过减少不断增长的需求来节省资金和能源。
  • 激光显示的四大核心器件国产化进程:自研芯片技术亟待提 激光显示的四大核心器件国产化程度从高到低依次为抗光幕布、激光光源、镜头、光成像芯片。技术突破下,预计未来3-5年内激光产业链国产化程度从45-55%提高至75%-80%,实现从技术领先到产业领先的跨越。
  • 中国科学家刷新纪录,达成百兆比特率的实时量子密钥分发 近日,中国科学技术大学潘建伟、徐飞虎等与上海微系统所、济南量子技术研究院、哈尔滨工业大学等单位的科研人员合作,通过发展高保真度集成光子学量子态调控、高计数率超导单光子探测等关键技术,首次在国际上实现百兆比特率的实时量子密钥分发,实验结果将此前的成码率纪录提升一个数量级。
  • PUF技术进展:可省去ID注册阶段的新PUF IP问世 物理不可克隆功能(physically unclonable function, PUF)技术运用了简单、经济高效且灵活、无需存储密钥的方式,建立信任根(Root of Trust)。然而,当PUF应用于替芯片产生特定密钥,还要确保不同芯片间ID的低重复率仍具有挑战性... 
  • 磁子电子学新突破,可用于芯片和雷达的光诱导磁子态 日前,据上海科技大学官网消息,上海科技大学物质科学与技术学院陆卫教授课题组在光子-磁子相互作用及强耦合调控方向取得重要进展。研究团队首次在铁磁绝缘体单晶中发现了一种全新的磁共振,命名为光诱导磁子态(pump-induced magnon mode, PIM)。
  • 原子钟在数据中心的作用:原子从对数据造成不利影响到带 利用原子钟授时现已成为数据中心不可或缺的组成部分。目前,通过全球定位系统(GPS)和其他全球导航卫星系统(GNSS)网络传输的原子钟时间已使全球各地的服务器实现了同步,并且部署在各个数据中心的原子钟可在传输时间不可用时保持同步。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了