AI钞能力:阿联酋打造的Falcon-40B语言模型OpenLLM排名第
2023-06-14 13:40 来源:IT之家 阅读量:6263
,众所周知,阿联酋在科技及教育产业方面投入的预算一直不菲,近日,阿联酋科技创新研究所打造出了 400 亿参数的语言模型 Falcon-40B,在 Hugging Face 的 OpenLLM 排行榜上排名第一,并持续霸榜,赢过此前 LLaMA、StableLM 和 RedPajama 等竞争者。
据称,Falcon-40B 使用了 384 颗 GPU 来进行 2 个月的训练、利用将近 5 亿个 Token 训练而成。为提高训练过程的质量,团队还自己组建了一套工作流程来筛选出“最高质量的的资料”供给 AI 模型训练。经多个基准测试,表现比 LLaMA、Vicuna 和 Alpaca 更加出色。
此外,团队还采用了“多重查询注意力”机制,来提高模型的效率。“多重查询注意力”机制即模型可以对每个 Token 进行多个查询,来更好表示同一序列中,不同 token 之间的关系,以在加速模型运算效率的同时,降低模型的复杂性,进而提高模型整体的可维护性。
阿联酋科技创新研究所首席执行官 Ray O. Johnson 博士表示:“2023 年将是人工智能之年。Falcon 模型对我们来说具有里程碑意义,但这仅仅是个开始”。
IT之家注意到,Falcon 模型已经在 huggingface 上开源,目前开源的版本有 Falcon-7B-Instruct 和 Falcon-40B-Instruct 等,IT之家的小伙伴们可以在这里访问。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
为您推荐
精彩放送
热门文章
热文
-
DDR42666MHz:铨兴16G台式机内存条119元6期免息新低
-
南京江宁高新区开启元宇宙三年行动计划,到2025年产业规模200亿元
-
我为什么卖掉400平大房子预订泰康之家,这7个理由希望能启发更多人!
-
Debian13“Trixie”Linux发行版有望将带来RISC-V6
-
西安交大与旷视科技联手共建人机混合增强智能全国重点实验室
-
7天期逆回购利率调降“多米诺效应”海外量化资金借机沽空人民币套利
-
中信银行合肥分行成功举办公积金业务“就近办”银行揭牌仪式
-
全国小麦进入集中收获期各地交通运输部门力保农机运输车通行顺畅
-
互动中化岩土:参股的美国掣速科技的产品可兼容匹配英伟达高性能GPU服务器
-
TrendForce:2023一季度前十大晶圆代工企业营收环比减少近两成