为什么复旦MOSS大模型的中文水平不如英文?
App2月21日消息,2月20日晚间,复旦大学邱锡鹏教授团队发布国内首个类ChatGPT模型MOSS,引发各界人士参与内测的热情。一个显著的反馈是,MOSS
(资料图)
App 2月21日消息,2月20日晚间,复旦大学邱锡鹏教授团队发布国内首个类ChatGPT模型MOSS,引发各界人士参与内测的热情。一个显著的反馈是,MOSS的英文回答水平比中文高,这在公众与ChatGPT的互动中也有类似体现。为何如此? 深圳粤港澳大湾区数字经济研究院(IDEA)认知计算与自然语言中心文本生成算法团队负责人王昊表示,“数据质量的差别是主要瓶颈之一。相较于英文数据,中文数据的开源程度较低,导致中文数据集的规模相对较小。此外,英文作为科研主流语言,在学术界和工业界中得到广泛应用,积累了大量高质量的语料数据,这为英文自然语言处理的研究提供了极大的优势。”MOSS研究团队也坦承,“MOSS的英文回答水平比中文高,因为它的模型基座学习了3000多亿个英文单词,中文词语只学了约300亿个。”(澎湃)
关键词:
责任编辑:hnmd004
- 为什么复旦MOSS大模型的中文水平不如英文?2023-02-21
- 焦点速看:中国电建承建的光伏电站扩建项目2023-02-21
- 【全球报资讯】汽车整车板块走强,江淮汽车2023-02-21
- 国家能源局:要加大力度推进大型风电光伏发2023-02-21
- 世界热头条丨澳门MCSD债券回购业务落地2023-02-21
- 全球百事通!自主研发光伏系统销往世界各地2023-02-21
- 当前时讯:德国经济部长:2030年80%电力为2023-02-21
- 每日时讯!去年我国光伏发电平均利用率98.3%2023-02-21
- 汇率计算公式讲解 津巴布韦100亿相当于多2023-02-21
- 公积金贷款怎么贷?商业贷款利率是多少?2023-02-21
- 京东白条怎么关闭?京东白条上征信吗?2023-02-21
- 世界热消息:2023年,餐饮业正迎来七大新趋2023-02-21
- 交强险赔偿范围和金额限额是多少?最新交强2023-02-21
- 养老金计算公式是什么?2023养老认证时间2023-02-21
- 恒金币是什么?恒金是金子吗?最值钱的金币2023-02-21
- 汪雨家到底是什么来头?汪雨真实身份曝光2023-02-21
- 一个比特币值多少人民币?比特币今天价格2023-02-21
- 2025年合村并镇是全面实行吗?明年起农村房2023-02-21
- 七一勋章材质是什么做的?七一勋章含金量多2023-02-21
- 14天超1.5万例本土感染者 如何应对 感染2023-02-21
- 海航机长杜文奇现状 海航机长杜文奇后续处2023-02-21
- 今日要闻!简单山水风景画_简笔画大全风景山2023-02-21
- 热门:港股中国投资基金公司跌超20%2023-02-21
- 焦点热讯:SSD价格继续下跌且跌幅扩大2023-02-21
- 全球快看:机器人板块震荡走高,凯尔达涨15%2023-02-21
- 三峡能源与金风科技座谈2023-02-21
- 中炬高新回应两名高管被留置调查:和味美鲜2023-02-21
- 每日热点:东方电气集团与内蒙古能源集团签2023-02-21
- 最新资讯:粤电力:“十四五”计划新增风电2023-02-21
- 全球速递!中国电信等34股近五日获机构净买2023-02-21