Meta发布Llama 3.2，Llama 终于能看见了！

nidongde2024-09-26 10:00:1048

Llama家族再添新成员，多模态能力终于到来！

Meta刚刚发布了Llama 3.2模型系列，包括多模态视觉模型和小型文本模型，共计10个开放权重模型。

这次更新不仅带来了期待已久的视觉能力，还为移动设备和边缘计算提供了更多选择。

多模态Llama：视觉能力终于解锁

Llama 3.2 Vision模型终于为Llama家族带来了多模态能力。它提供了两种尺寸：

11B版本：适合在消费级GPU上高效部署和开发
90B版本：适用于大规模应用

90B版本中，其中18B用于新视觉功能。

并且，模型在视觉能力上超越了所有闭源模型。

这两个版本都有基础模型和指令微调变体。除此之外，Meta还发布了支持视觉的Llama Guard 3新版本，可以对模型输入和输出进行分类，包括检测有害的多模态提示或助手回复。

小而强大：1B和3B文本模型登场

Llama 3.2还推出了可在设备上运行的小型文本语言模型，包括1B和3B两种新尺寸，每种都有基础和指令变体。这些模型具有强大的能力：

支持多语言：英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语
长上下文：支持128k token的长上下文
性能出色：3B模型在IFEval基准测试上的表现与8B模型相当

这些小型模型非常适合提示重写、多语言知识检索、摘要任务、工具使用和本地运行的助手等应用场景。

技术细节：模型架构与训练

Llama 3.2 Vision模型的架构基于Llama 3.1 LLM与视觉塔和图像适配器的组合：

11B Vision模型使用Llama 3.1 8B作为文本模型
90B Vision模型使用Llama 3.1 70B作为文本模型

据了解，在训练视觉模型时，文本模型被冻结以保持文本性能。这些模型在包含60亿图像-文本对的大规模数据集上进行了训练。

小型文本模型遵循与Llama 3.1相同的架构，使用高达9万亿token进行训练，同样支持128k token的长上下文。

超强性能

Meta公布的基准测试结果显示，Llama 3.2 Vision模型在多个任务上表现出色：

MMMU（验证集）：11B模型达到50.7%，90B模型达到60.3%
VQAv2（测试集）：11B模型达到75.2%，90B模型达到78.1%
DocVQA（测试集）：11B模型达到88.4%，90B模型达到90.1%

小型文本模型的性能同样令人惊喜。在Open LLM Leaderboard评估中，3B模型在某些任务上甚至接近8B模型的表现。特别是在IFEval基准测试中，3B指令模型与8B指令模型表现相当，这使其非常适合需要严格遵循指令的应用场景。

许可变更：欧盟用户受限

值得注意的是，Llama 3.2的许可条款有一项重要变更：欧盟境内的个人或公司不被授予使用Llama 3.2多模态模型的许可权利。这一限制不适用于最终用户，因此开发者仍可使用这些模型构建面向全球的产品。

生态系统支持：便捷使用与部署

Hugging Face生态系统为Llama 3.2提供了全面支持：

模型权重已上传至Hub
Transformers和TGI集成了Vision模型
支持通过Inference Endpoints、Google Cloud、Amazon SageMaker和DELL Enterprise Hub进行推理和部署
提供了在单个GPU上微调Llama 3.2 11B Vision的示例

此外，还可以使用TRL对文本模型进行聊天和微调，Vision模型的微调支持也已添加到TRL中。

Llama家族的重要里程碑

Llama 3.2的发布标志着Meta在大语言模型领域又迈出了重要一步。多模态能力的加入和小型高效模型的推出，为研究人员和开发者提供了更多可能性。

本文链接：https://hzby.vip/Llama3/57.html

Llama 3模型下载 Openbuddy微调版本有没有开源的llama模型 llama模型支持中文吗可商用大模型llama llama模型训练需要多大显存 llama2模型规模 llama中文训练模型 llama模型怎么用 meta llama模型原理

Meta刚开源llama 3.2多模态，就被打败了~
2个系列：多模态：Llama 3.2 11B 和 90B，支持视觉多模态，LLama终于有了眼睛！端侧小模型：LLama 3.2 1B 和 3B对于新增的多模态模型，只新增了图像编码器，将其集成到预训...
Llama3资讯2024-09-26291llama大模型 llama开源模型有监督微调有没有开源的llama模型 llama模型是谁开发的 llama模型羊驼 llama模型与达芬奇模型 llama2模型微调 llama 中文大模型 llama模型下载地址 llama2大模型哪个团队的
Meta发布Llama 3.2 - 小中型视觉模型与轻量级文本模型
9月25日，Meta发布了Llama 3.2,包括小型和中型视觉语言模型(11B和90B),以及适用于边缘和移动设备的轻量级纯文本模型(1B和3B),包括预训练版本和指令微调版本。您需要知道的Llam...
Llama3资讯2024-09-2646Llama-8B llama是啥意思 Llama 3.2 llama2模型是哪家公司 llama模型部署教程 Llama 3.1 llama 65b模型部署 llama评分模型 Llama 3 llama模型python
Llama 3.2：AI视觉革新，手机也能跑大模型
Meta最新发布的Llama 3.2不仅能"看"，还能在你的手机上运行。这次更新带来了多模态支持的Llama Vision和专为设备端优化的"tiny"模型，共...
Llama3资讯2024-09-2644微调 Llama3 大模型 llama2模型是什么架构 llama模型测试 llama模型本地部署 llama大模型训练框架 llama是基于什么原理的模型 llama模型文件大小 llama模型架构 llama2模型教程如何部署llama2大模型
又泄露了！llama3 405B明天发布，7B和70B迎来重大升级
又泄露了，前2个周是说7.23号发布llama3 405B，很多api供应商都表示第一时间接入。昨天是因为建立仓库忘记私有化了，很短的时间，然后又被抓住了，缓存了一个空页面下来。全网的llama3消息...
Llama3资讯2024-07-22318llama3 405B llama4
Meta将在本月23日发布LLaMA-3-405B大模型
根据The Information网站记者的报道，Meta将在本月23日发布LLaMA-3-405B大模型！社区听到这个消息后是这样婶地：Meta将Llama-3-405B的上下文长度扩展到了128K...
Llama3资讯2024-07-13358Llama 3模型下载 llama大模型微调 Llama3 大模型微调 Llama3 llama大模型 llama大模型c语言版本 llama模型下载地址 llama模型训练需要多大显存 llama 模型结构 llama模型是什么架构
基于Llama 3搭建中文版（Llama3-Chinese-Chat）大模型对话聊天机器人
前面两篇博文，我们分别在个人笔记本电脑部署了Llama 3 8B参数大模型，并使用Ollama搭建了基于 Web 可视化对话聊天机器人，可以在自己电脑上愉快的与Llama大模型 Web 机器人对话聊天...
Llama3资讯2024-07-11328微调 Llama3 llama模型羊驼 llama模型测试 llama开源模型 llama 2 大模型详解可商用大模型llama llama人工智能语言模型 llama模型python llama大模型用的是什么框架 llama模型哪个最好
应该怎么训练大模型，大模型的训练流程是什么样的？
“ 大模型的核心主要有两部分，一是训练数据，二是机器学习模型。”现在大模型发展得如火如荼，但是没有学过人工智能技术的开发者，只会调用其接口，但不清楚怎么训练一个大模型。今天就简单介绍一下自己...
Llama3资讯2024-07-10187meta llama模型开源 llama2模型是哪家公司 llama2模型微调 llama模型本地部署 llama模型下载地址可商用大模型llama llama2模型规模 llama模型怎么微调 llama 模型结构 llama模型哪个最好
开源的LLaMA-3模型来了，首批发布8B和70B，更多的版本还在路上，最大模型可以到400B
开源的LLaMA-3终于来了：首批发布两个版本，8B和70B，更多的版本还在路上，最大模型可以到400B，多模态。重要的是开源，而且现在就可以在meta ai里进行体验。当然，其他重要的要点也要过一遍...
Llama3资讯2024-07-10197Meta 开源模型 llama.meta.com/llama3 Llama 3模型下载 Llama-3官方模型权重地址 Llama-8B Llama-3-70B Llama-3-400B

Meta发布Llama 3.2，Llama 终于能看见了！

相关文章

Meta刚开源llama 3.2多模态，就被打败了~

Meta发布Llama 3.2 - 小中型视觉模型与轻量级文本模型

Llama 3.2：AI视觉革新，手机也能跑大模型

又泄露了！llama3 405B明天发布，7B和70B迎来重大升级

Meta将在本月23日发布LLaMA-3-405B大模型

基于Llama 3搭建中文版（Llama3-Chinese-Chat）大模型对话聊天机器人

应该怎么训练大模型，大模型的训练流程是什么样的？

开源的LLaMA-3模型来了，首批发布8B和70B，更多的版本还在路上，最大模型可以到400B

网友评论