首页 > 要闻 >

百川智能发布开源中英文大模型,多个榜单评测成绩最佳 全球焦点

2023-06-15 14:30:52 来源:蓝鲸财经

2023年6月15日,被称为「中国ChatGPT梦之队」的百川智能公司,推出了70 亿参数量的中英文预训练大模型——baichuan-7B。baichuan-7B不仅在C-Eval、AGIEval和Gaokao中文权威评测榜单上,以显著优势全面超过了ChatGLM-6B等其他大模型,并且在MMLU英文权威评测榜单上,大幅领先LLaMA-7B。

目前baichuan-7B大模型已在Hugging Face、Github以及Model Scope平台发布。


(资料图片)

开源地址:

Hugging Face:https://huggingface.co/baichuan-inc/baichuan-7B

Github:https://github.com/baichuan-inc/baichuan-7B

Model Scope:https://modelscope.cn/models/baichuan-inc/baichuan-7B/summary

多个最具影响力中文评估基准7B最佳

为了验证模型的各项能力,baichuan-7B在C-Eval、AGIEval和Gaokao三个最具影响力的中文评估基准进行了综合评估,并且均获得了优异成绩,它已经成为同等参数规模下中文表现最优秀的原生预训练模型。

在中文C-EVAL的评测中,baichuan-7B的综合评分达到了42.8分,超过了ChatGLM-6B的38.9分,甚至比某些参数规模更大的模型还要出色。

https://cevalbenchmark.com/static/leaderboard_zh.html(时间为2023-06-15)

C-Eval评测基准由上海交通大学、清华大学以及爱丁堡大学联合创建,是面向中文语言模型的综合考试评测集,覆盖了52个来自不同行业领域的学科。

在AGIEval的评测里,baichuan-7B综合评分达到34.4分,远超LLaMa-7B、Falcon-7B、Bloom-7B以及ChatGLM-6B等其他开源模型。

AGIEval评测基准由微软研究院发起,旨在全面评估基础模型在人类认知和问题解决相关任务上的能力,包含了中国的高考、司法考试,以及美国的SAT、LSAT、GRE和GMAT等20个公开且严谨的官方入学和职业资格考试。

在GAOKAO评测中,baichuan-7B的综合评分达到了36.2分,显著领先于同参数规模的各种其他预训练模型。

GAOKAO评测基准是复旦大学研究团队创建的评测框架,以中国高考题目作为数据集,用于测试大模型在中文语言理解和逻辑推理能力方面的表现。

MMLU英文评估基准表现大幅领先LLaMA-7B

baichuan-7B不仅在中文方面表现优异,在英文上表现同样亮眼。在MMLU的评测中baichuan-7B综合评分高达42.5分,大幅领先英文开源预训练模型LLaMA-7B的34.2分以及中文开源模型ChatGLM-6B的36.9分。

MMLU由加州大学伯克利分校等知名高校共同打造,集合了科学、工程、数学、人文、社会科学等领域的57个科目,主要目标是对模型的英文跨学科专业能力进行深入测试。其内容广泛,从初级水平一直涵盖到高级专业水平。

万亿优质数据、4K上下文窗口、高效稳定训练造就领先7B预训练模型

训练语料对大模型的训练结果至关重要。在构建预训练语料库方面,百川智能以高质量中文语料为基础,同时融合了优质的英文数据。在数据质量方面,通过质量模型对数据进行打分,对原始数据集进行篇章级和句子级的精确筛选;在内容多样性方面,利用自研超大规模局部敏感哈希聚类系统和语义聚类系统,对数据进行了多层次多粒度的聚类,最终构建了包含1.2万亿token的兼顾质量和多样性的预训练数据。相较于其他同参数规模的开源中文预训练模型,数据量提高了超过50%。

在万亿优质中英文数据的基础上,为了更好地提升训练效率,baichuan-7B深度整合了模型算子来加快计算流程,并针对任务负载和集群配置,自适应优化了模型并行策略以及重计算策略。通过高效的训练过程调度通信,baichuan-7B成功地实现了计算与通信的高效重叠,进而达到了超线性的训练加速,在千卡集群上训练吞吐达到180+Tflops的业界领先水平。

同时,已有的开源模型窗口长度在2K以内,对于一些长文本建模任务,如需要引入外部知识做搜索增强的场景,更长的处理长度有助于模型在训练与推理阶段捕获越多的上下文信息,2K的处理长度存在比较大的制约。baichuan-7B基于高效的attention算子优化实现了万级别超长动态窗口的扩张能力,本次开源的预训练模型开放了4K上下文窗口,使模型应用场景更加广泛。

此外,baichuan-7B还对模型训练流程进行了深度优化,采用了更科学且稳定的训练流程和超参数选择,使得 baichuan-7B模型的收敛速度大大提升。与同等参数规模的模型相比,baichuan-7B在困惑度(PPL)和训练损失(training loss)等关键性能指标上表现更加优秀。

免费可商用,清华北大率先使用助力研究

秉持开源精神,baichuan-7B代码采用Apache-2.0协议,模型权重采用了免费商用协议,只需进行简单登记即可免费商用。

baichuan-7B此次开源的内容十分丰富,包含了推理代码、INT4量化实现、微调代码,以及预训练模型的权重。其中,微调代码方便用户对模型进行调整和优化;推理代码与INT4量化实现则有助于开发者低成本地进行模型的部署和应用;预训练模型权重开源后,用户则可以直接使用预训练模型进行各种实验研究。

据了解,北京大学和清华大学两所顶尖大学已率先使用baichuan-7B模型推进相关研究工作,并计划在未来与百川智能深入合作,共同推动baichuan-7B模型的应用和发展。

清华大学互联网司法研究院院长、计算机系教授刘奕群认为, baichuan-7B模型在中文上的效果表现十分出色,它免费商用的开源方式展现出开放的态度,不仅贡献社区,也推动技术发展。团队计划基于baichuan-7B模型开展司法人工智能领域的相关研究。

北京大学人工智能研究院助理教授杨耀东认为,baichuan-7B模型的开源将对于中文基础语言模型的生态建设及学术研究产生重要推动作用,同时他也表示将持续关注相关领域探索,并且在中文大语言模型的安全和对齐上进行进一步深入研究。

百川智能CEO王小川表示:“本次开源模型的发布是百川智能成立2个月后的第一个里程碑,对百川智能而言是一个良好的开局。baichuan-7B模型,不仅能为中国的AGI事业添砖加瓦,也为世界大模型开源社区贡献了新的力量。”

上一篇:

安正文黄鹤楼图轴

下一篇:

最后一页

x
推荐阅读

百川智能发布开源中英文大模型,多个榜单评测成绩最佳 全球焦点

安正文黄鹤楼图轴

爱的回归线歌词含义(爱的回归线歌词)

《暗黑破坏神4》官网入口地址 官网地址详情 最资讯

周三两市成交额重回万亿 22只行业龙头却创年内新低 依然是结构性行情?|晨会博弈

当前时讯:国家统计局:青年失业率处在高位,有600多万目前还在寻找工作

教育系统推进“互联网+就业”模式 助力高校毕业生更好就业-世界聚焦

环球快资讯:太原表彰无偿献血先进单位和个人

登上热搜,已有人被骗!车主收到这条ETC短信请立即删除

【环球播资讯】河北:949个绿色通道保障农机运输车辆顺畅高效通行

祝福人生日的词语 祝福人生日的词语全部 每日消息

日本核污水排海时间临近 韩国消费者大量购买海盐

天翼网关wifi不能上网 全球资讯

单眼 4K,索尼去年展示苹果 Vision Pro 头显屏幕视频曝光

环球消息!欣旺达(300207):6月14日北向资金减持356.58万股

世界即时:6月14日基金净值:工银聚润6个月持有混合A最新净值0.9681,涨0.03%

16进制转压缩bcd码_压缩bcd码

壮游奇迹恶魔广场进入等级(奇迹恶魔广场怎么进)

阶梯用电是一年一算么_阶梯电费是一年一算吗简介介绍

什么是出入库单据_什么是出入库-环球热点评

【时快讯】女儿发来求救视频,“绑匪”索要500万赎金?假绑架真诈骗!

金科服务6月14日回购10.50万股 耗资118.06万港币-环球快播

县领导赴外婆湖检查企业食品安全工作

江门市气象台发布暴雨橙色预警【II级/严重】【2023-06-14】

米修米修是什么意思(米修米修的含义)

天天新资讯:超级拖拉机大冒险相关内容介绍

央行降息也带不动?美股新高A股又跳水,内资又砸盘在怂什么

蒸湘交警进社区、农村开展“两易群体”交通安全宣传活动

人红是非多,比亚迪招聘985、211学生,成学历歧视了? 重点聚焦

安科瑞(300286.SZ):董事、副总经理朱芳大宗交易减持101.37万股 每日头条

世界看点:iphone4s白苹果黑屏(iphone4s白苹果)

全球微动态丨蔚来全系车型降价3万元,新车主权益迎调整

宿迁市宿城区屠园镇:开展农民喜爱的百种图书推广活动

广西:与全球100多个国家和地区的200多个港口实现通航

每日看点!翻新版PS5精英手柄开卖:售价1074元

六福内地铂金多少钱一克(2023年06月14日)

从统信UOS看国产操作系统产业生态破局之路

2023年中级经济师哪门容易过?

2023年6月14日亚盘交易建议:黄金、白银、欧元、英镑、日元、瑞郎交易点位技术分析及预测-天天观速讯

海南商业航天发射场3号发射工位开工

沈阳文旅宠粉再升级 多家景区推出延迟闭馆服务|焦点快看

谁是配送界的“武林高手”?普陀的他们“过关斩将”展风采→-环球动态

手机连wifi卡怎么回事_手机连上wifi却上不了网怎么回事

每日速递:为玩具产业提供“一站式”服务

罗马诺:姆巴佩否认今夏离队并没有改变巴黎的立场

原油收盘:中国经济刺激计划提振需求前景 原油期货大幅收涨-观焦点

每日热闻!银行降息之后,2项理财方式更赚钱,不仅利息高,还可赚价差

当前观点:高二通用技术筷子作品 高中生通用技术筷子手工作品照片

世界热点!蒙扎下赛季要起飞呀。蒙扎被卖给了希腊船王,船王现...

*ST广田: 关于持股5%以上股东减持计划期限届满暨未来减持计划的预披露公告