Meta 在其官网发布Llama 3 并称:迄今为止最强的开源大语言模型。
最先进的性能:8B 版本领先同量级开源,70B 版本打平闭源谷歌和Anthropic 模型:
我们新的 8B 和 70B 参数 Llama 3 模型是 Llama 2 的重大飞跃,并为这些规模的 LLM 模型建立了新的最先进技术。由于预训练和训练后的改进,我们的预训练和指令微调模型是当今 8B 和 70B 参数规模的最佳模型。我们训练后程序的改进大大降低了错误拒绝率,改善了一致性,并增加了模型响应的多样性。我们还看到了推理、代码生成和指令跟踪等功能的极大改进,使 Llama 3 更加易于操控。
最为重磅的是:对标GPT-4 的 400B 版本开源模型已经在路上
我们最大的模型有超过 400B 个参数,虽然这些模型仍在训练中,但我们的团队对它们的趋势感到兴奋。在接下来的几个月中,我们将发布多个具有新功能的模型,包括多模态、以多种语言交谈的能力、更长的上下文窗口和更强的整体功能。一旦我们完成 Llama 3 的训练,我们还将发布一份详细的研究论文。
为了让您先睹为快,了解这些模型在继续训练时的现状,我们认为可以分享一些关于我们最大的 LLM 模型趋势的快照。请注意,此数据基于 Llama 3 的早期检查点,该检查点仍在训练中,并且今天发布的模型不支持这些功能。
英伟达人工智能主管 Jim Fan 表示:
即将到来的Llama-3-400B+将标志着一个分水岭时刻,社区将获得对GPT-4级别模型的开放重量级访问。它将改变许多研究工作和草根初创企业的计算方式。我对Claude 3 Opus、GPT-4-2024-04-09和Gemini的数据进行了分析。
Llama-3-400B仍在训练中,希望在未来几个月内能变得更好。有了这样一个强大的后盾,可以解锁许多研究潜力。预计整个生态系统的建设者能量将会出现激增!
本文链接:https://hzby.vip/Llama3/19.html
llama和ChatGPTllama是啥意思llama3 需要多大显存llama大模型llama 3llama模型llama对齐算法llama 2Llama-3-400B
网友评论