千呼万唤始出来,Meta 今天正式发布Llama-3初始版本,包括 8B、70B 以及正在训练的 400B 模型。
Llama-8B 上下文长度为8K,使用15T tokens训练,训练数据截止到2023年3月。整体性能接近 Llama-2-70B,各方面指标超过了 Gemma-7B-it 和 Mistral-7B instruct。
Llama-3-70B 上下文长度为8K,使用15T tokens训练,训练数据截止到2023年12月。在 MMLU 评估基准上得分为 82,而 Mixtral 8x22B 得分为 77, Claude-3-sonnet 得分为 79。llama-3-70B 成为最强开源模型!
Llama-3-400B 目前正在训练中,但是各方面指标显示,该模型已经进入排行榜第一梯队。
Llama-3唯一的缺陷是上下文长度只有8K,不过Meta在llama-3的发布页上提到,接下来会发布更长上下文长度以及更好性能的模型。
【模型测试】
Llama-3具有超强的指令遵循能力,从Chat Arena上的对比测试可以看出,Llama-3-70B和8B的回答都是正确的,而Claude-3-sonnet没有遵循指令。
Llama-3-8B的推理能力同样强大,Claude-3-sonnet回答错误,llama-3-8B回答正确,太残暴了!
Llama-3-70B可以正确回答下面问题,而 Claude-3-sonnet回答错误。
If we lay 5 shirts out in the sun and it takes 4 hours to dry, how long would 20 shirts take to dry? Explain your reasoning step by step.
【模型下载】
1. Meta提供了免费服务:
https://www.meta.ai
2. 官方模型权重地址:
8B Instruct:
https://huggingface.co/meta-llama/Meta-Llama-3-8B-Instruct
70B Instruct:
https://huggingface.co/meta-llama/Meta-Llama-3-70B-Instruct
3. GGUF 版本地址:
8B Instruct:
https://huggingface.co/MaziyarPanahi/Meta-Llama-3-8B-Instruct-GGUF
70B Instruct:
https://huggingface.co/MaziyarPanahi/Meta-Llama-3-70B-Instruct-GGUF
4. Ollama 地址:
https://ollama.com/library/llama3
本文链接:https://hzby.vip/Llama3/5.html
Ollama 地址GGUF 版本地址Llama-3官方模型权重地址Llama-8BLlama-3-70BLlama-3-400B
网友评论