Llama官网|llama3 本地部署|llama3下载

开源的LLaMA-3模型来了，首批发布8B和70B，更多的版本还在路上，最大模型可以到400B

nidongde2024-07-10 11:06:16197

开源的LLaMA-3终于来了：首批发布两个版本，8B和70B，更多的版本还在路上，最大模型可以到400B，多模态。

重要的是开源，而且现在就可以在Meta ai里进行体验。

当然，其他重要的要点也要过一遍（如果要看比我总结的更好的Gemini 1.5的版本，请直接滚动屏幕到最后）：

首先是模型表现，最小的8B版本的模型自然显著超越其他同规模参数的开源模型，发出来的70B参数版本甚至有跟Gemini 1.5一比的“勇气"。如今的评分虽然存在诸多问题，但是，最大版本的LLaMa-3（400B参数版本）的能力达到GPT-4甚至部分超越，是我们可以得到的很安全的推论；

其次，模型训练数据达到了15T，时间关系，我没有详细去看LLaMA-2的训练数据量，但是记忆中应该在2T-3T的这个数量级，这意味着至少五倍数据量的增加；

三，70B参数（七百亿）模型的训练时间是640w个GPU小时（H100-80GB，700W版本，就是最高配的nvlink连接的那种），如果假设训练时间是90天，意味着2963张卡。但是按照其他模型披露的更多技术细节看，一般训练的90天时长里，三分之一用于预训练，三分之二用于测试、精调、对齐，所以，七百亿参数的模型大概动用的集群规模差不多是8000-10000块H100。由于400B的模型还在优化（训练），meta介绍里披露的是：最大模型用了1.6万个GPU；这里面还有个有意思的细节，虽然70B的规模比8B增长了超过8倍，但是训练用的GPU时间只是5倍不到，其中原因当然是因为70B用的GPU集群更大，但这也告诉我们，至少在两万张卡的集群的范围下，规模越大，效率越高；

四、Scaling Law依然还在：无论是8B还是70B模型，训练数据量从200B提升到15T的过程中，看到了显著的表现提升，意味着这条道路依然可以走下去；

五、训练用了31种语言（非英语的占比5%）。训练部分的编码的词库达到了128K个token，每个batch size是8k。虽然可以在后续通过各种技术加入长上下文的支持，但是这依然意味着模型的输出能力相比其他主流模型并没有得到明显提升；

六、更大的400B（四千亿，多模态）模型还在路上，但是截止到4月15日的checkpoint的表现已经很惊人了；

结论

1、虽然Meta具备这样的能力，但是让LLaMA-3开源版本全面超越GPT-4（或者Claude3，Gemini 1.5），确实只是一个美好的期望。但是这一代的开源达到或接近GPT-4，meta实现了大家对LLaMa-3的期望；

2、正如前几天说的，最好的闭源是天花板，意味着人类可以达到的能力，最好的开源是全民福利，意味着都可以达到的基准，AI就是平权，虽然这种平权对商业机构而言，很可怕；

3、LLaMa-3对这一轮AI后面的发展重要性甚至超过预期中的GPT-5，我们可以看到在接下来三到六个月里，各种“模型继续刷榜”的盛况，每个人也都可以使用到更好的模型，但是模型依然不会成为每个人日常离不开的大APP，因为效率的提升有很多隐性门槛；

4、正如之前反复强调的，模型在AI真正落地中的重要性变得越来越低，生态、场景、数据、工作流，这些变得更为重要，对业务理解力和技术构架能力统一的要求变得更高；

5、几千亿规模模型的私有化部署和使用将变得越来越多，部署一个就是至少8张H100级别的GPU或者ASIC，对推理的需求看不到边界；

6、更好的大模型意味着可以有更好的小参数模型，超过上一代7B甚至13B表现的3B、2B甚至1B模型也将如雨后春笋般涌现，这将给AI手机、AI硬件的加速落地带来想象力更大的前景；

7、最后，一句话，趋势，还在变强。

Gemin 1.5的总结：

本文链接：https://hzby.vip/Llama3/16.html

Meta 开源模型 llama.meta.com/llama3 Llama 3模型下载 Llama-3官方模型权重地址 Llama-8B Llama-3-70B Llama-3-400B

相关文章

Meta刚开源llama 3.2多模态，就被打败了~
2个系列：多模态：Llama 3.2 11B 和 90B，支持视觉多模态，LLama终于有了眼睛！端侧小模型：LLama 3.2 1B 和 3B对于新增的多模态模型，只新增了图像编码器，将其集成到预训...
Llama3资讯2024-09-26291llama大模型 llama开源模型有监督微调有没有开源的llama模型 llama模型是谁开发的 llama模型羊驼 llama模型与达芬奇模型 llama2模型微调 llama 中文大模型 llama模型下载地址 llama2大模型哪个团队的
Meta发布Llama 3.2 - 小中型视觉模型与轻量级文本模型
9月25日，Meta发布了Llama 3.2,包括小型和中型视觉语言模型(11B和90B),以及适用于边缘和移动设备的轻量级纯文本模型(1B和3B),包括预训练版本和指令微调版本。您需要知道的Llam...
Llama3资讯2024-09-2646Llama-8B llama是啥意思 Llama 3.2 llama2模型是哪家公司 llama模型部署教程 Llama 3.1 llama 65b模型部署 llama评分模型 Llama 3 llama模型python
Llama 3.2：AI视觉革新，手机也能跑大模型
Meta最新发布的Llama 3.2不仅能"看"，还能在你的手机上运行。这次更新带来了多模态支持的Llama Vision和专为设备端优化的"tiny"模型，共...
Llama3资讯2024-09-2644微调 Llama3 大模型 llama2模型是什么架构 llama模型测试 llama模型本地部署 llama大模型训练框架 llama是基于什么原理的模型 llama模型文件大小 llama模型架构 llama2模型教程如何部署llama2大模型
Meta发布Llama 3.2，Llama 终于能看见了！
Llama家族再添新成员，多模态能力终于到来！Meta刚刚发布了Llama 3.2模型系列，包括多模态视觉模型和小型文本模型，共计10个开放权重模型。这次更新不仅带来了期待已久的视觉能力，还为移动设备...
Llama3资讯2024-09-2647Llama 3模型下载 Openbuddy微调版本有没有开源的llama模型 llama模型支持中文吗可商用大模型llama llama模型训练需要多大显存 llama2模型规模 llama中文训练模型 llama模型怎么用 meta llama模型原理
又泄露了！llama3 405B明天发布，7B和70B迎来重大升级
又泄露了，前2个周是说7.23号发布llama3 405B，很多api供应商都表示第一时间接入。昨天是因为建立仓库忘记私有化了，很短的时间，然后又被抓住了，缓存了一个空页面下来。全网的llama3消息...
Llama3资讯2024-07-22318llama3 405B llama4
Meta将在本月23日发布LLaMA-3-405B大模型
根据The Information网站记者的报道，Meta将在本月23日发布LLaMA-3-405B大模型！社区听到这个消息后是这样婶地：Meta将Llama-3-405B的上下文长度扩展到了128K...
Llama3资讯2024-07-13358Llama 3模型下载 llama大模型微调 Llama3 大模型微调 Llama3 llama大模型 llama大模型c语言版本 llama模型下载地址 llama模型训练需要多大显存 llama 模型结构 llama模型是什么架构
基于Llama 3搭建中文版（Llama3-Chinese-Chat）大模型对话聊天机器人
前面两篇博文，我们分别在个人笔记本电脑部署了Llama 3 8B参数大模型，并使用Ollama搭建了基于 Web 可视化对话聊天机器人，可以在自己电脑上愉快的与Llama大模型 Web 机器人对话聊天...
Llama3资讯2024-07-11328微调 Llama3 llama模型羊驼 llama模型测试 llama开源模型 llama 2 大模型详解可商用大模型llama llama人工智能语言模型 llama模型python llama大模型用的是什么框架 llama模型哪个最好
应该怎么训练大模型，大模型的训练流程是什么样的？
“ 大模型的核心主要有两部分，一是训练数据，二是机器学习模型。”现在大模型发展得如火如荼，但是没有学过人工智能技术的开发者，只会调用其接口，但不清楚怎么训练一个大模型。今天就简单介绍一下自己...
Llama3资讯2024-07-10187meta llama模型开源 llama2模型是哪家公司 llama2模型微调 llama模型本地部署 llama模型下载地址可商用大模型llama llama2模型规模 llama模型怎么微调 llama 模型结构 llama模型哪个最好

网友评论