小米AI大模型MiLM-6B首次曝光:64亿参数量,此前称不单独做ChatGPT|钛快讯
小米总部园区
在小米公司CEO雷军演讲前夕,其研发的人工智能(AI)大模型产品悄然现身。
钛媒体App获悉,8月11日,小米公司开发的大规模预训练语言模型MiLM-6B/1.3B登陆代码托管平台GitHub,参数规模最高达64亿,而且现身在C-Eval、CMMLU基准评测榜单。
(资料图)
截至当前,小米大模型MiLM-6B在C-Eval总榜单排名第10、同参数量级排名第1,平均分为60.2分,超过了阿里云Qwen-7B、OpenAI研发的ChatGPT(今年5月数据)等,而MiLM-1.3B排行第30名,平均分45.8分,接近谷歌投资的Anthropic公司的Claude 1.0版本大模型。
这是小米大模型产品的首次曝光,也是小米史上首个GPT大模型产品亮相。
事实上,随着ChatGPT风靡全球,今年4月14日,小米公司宣布成立小米 AI 实验室大模型团队,由栾剑带队向王斌汇报。据悉,AI实验室是小米AI战略的核心部门,而大模型负责人王斌曾在中科院从事了20多年NLP(自然语言处理)相关的研究和开发工作,2018年加入小米,2019年起负责AI实验室。
小米CEO雷军当时表示,公司正在研发一些技术和产品,等打磨好了再给大家演示。小米集团总裁卢伟冰称,小米目前拥有超过1200人的AI团队,会积极拥抱大模型,与业务深度结合,但不会像OpenAI一样。
今年6月,王斌对外透露,小米会去自研通用语言大模型,但不会单独发布一款类ChatGPT产品。他表示,小米第一步的目标基座模型参数在几百亿,而且小米大模型将会落地小爱同学、loT、自动驾驶、机器人等现有场景中,并利用丰富的应用场景反哺大模型能力。
成立仅仅四个月后的今天,小米公布了大模型产品——MiLM-6B,并在C-Eval和CMMLU基准评测上均取得同尺寸较好效果。
其中,在C-Eval评估中,MiLM-6B的平均得分为60.2,在不同学科和难度级别(如STEM、社会科学、人文学科等)得分从42分到71.7分不等。在CMMLU评估中,MiLM-6B在零样本和五样本测试中的平均得分分别为60.37分和57.17分,表现出良好的知识和推理能力。
据悉,C-Eval榜单是清华大学、上海交通大学和爱丁堡大学共同构建的综合汉语模型评估套件,而CMMLU则是综合汉语模型基准。
预计小米将会于8月14日举行2023雷军年度演讲,但目前雷军暂未透露是否会发布MiLM-6B大模型技术。
钛媒体App向团队询问关于MiLM-6B/1.3B是否开源、产品是否已经落地内测等问题,截至发稿前暂未得到小米官方回复。(本文首发钛媒体App,作者|林志佳)
标签:
- 小米AI大模型MiLM-6B首次曝光:64亿参数量,此前称不单独做ChatGPT|钛快讯
- 兼职时薪高达36美元!联合包裹(UPS.US)慷慨加薪 联邦快递(FDX.US)“压力山大”
- 国网武汉供电“小黄人”带电作业 “汗”卫清凉
- 持续发力!烟台港航公安夏季治安打击整治行动添战果
- 中关村科技租赁(01601)与四川併济科技订立融资租赁协议
- 国联证券:上半年净利润同比增长37.30%
- 大连市普兰店区总工会开展城市骑手平安关爱行动
- 奥特迅:充电费用上涨对公司营收有积极作用,公司具体业绩情况请您届时关注公司定期报告
- 甄嬛传一共多少集演完_甄嬛传一共有多少集
- 湖北交投向明河收费站护航漂流季,服务走“心”又走“新”
- 证监会召集线上房地产会议 万科、保利、龙湖等房企参与
- 新能源车“骗补”揭底
- 新手怎么把抖音做起来?抖音起步养号细则
- 文远知行副总黄烨华比另两位副总低调 公司高管变动快COO都离职
- 第500万辆新能源汽车正式下线,谁成就了比亚迪傲人成绩?
- 泰凌微(688591)新股概览,8月16日开始网上申购
- 沧州二胎承诺书从哪下载?(附准生证办理流程)
- 俄两名宇航员完成今年第五次太空行走
- 农业农村部进一步部署防范台风“卡努”造成作物倒伏
- 组合充电单元受损出现工作异常,部分国产及进口宝马汽车被召回
- 国际锐评丨美方对华投资限制令是支“回旋镖”
- 航空工业自控所:潮鸣电掣,聚沙成塔
- 襄阳市中医医院开展“中医先锋行”中医经典知识大赛
- 新人妲己娜然,差点就当了成龙儿媳妇?
- 8月11日生意社EPS基准价为9750.00元/吨
- 沪深交易所将完善交易制度推动活跃市场
- 暴雨蓝色预警继续:河北四川广西等地局地有大暴雨
- 带鱼怎么去除内脏_带鱼怎么去内脏
- 北京房山区史家营中心小学留守人员:失联四天坚守校园 拆梯当柴展开自救
- 局部暴雨!明日夜里至12日河南有一次对流性天气过程