国投证券：计算机行业周报：Llama3发布，开源大模型能力进一步提升

发布者：wx****13

2024-04-22

1 MB 16 页

互联网国投证券

文件列表：

国投证券：计算机行业周报：Llama3发布，开源大模型能力进一步提升.pdf

下载文档

资源简介

Llama3发布，提升开源大模型能力上周四，Meta正式发布了人们等待已久的开源大模型Llama3。Meta表示，Llama3在多个关键的基准测试中性能优于业界先进同类模型，其在代码生成等任务上实现了全面领先，能够进行复杂的推理，可以更遵循指令，能够可视化想法并解决很多微妙的问题。 Llama3的主要亮点包括：基于超过15Ttoken训练，相当于Llama2数据集的7倍还多；支持8K长文本，改进的tokenizer具有128Ktoken的词汇量，可实现更好的性能；在大量重要基准中均具有最先进性能；新能力包括增强的推理和代码能力；训练效率比Llama2高3倍；带有LlamaGuard2、CodeShield和CyberSecEval2的新版信任和安全工具。8B和70B版本Llama3模型已用于MetaAI助手，同时也面向开发者进行了开源，包括预训练和微调版本。 Llama3在训练数据集上有明显提升：Llama3使用超过15T的token进行了预训练，这些token都是从公开来源收集的。总体上讲，Llama3的训练数据集是Llama2使用的数据集的七倍多，并且包含四倍多的代码。为了为即将

加载中...

已阅读到文档的结尾了

下载文档