Llama-3各版本有什么区别?
Meta 今天正式发布Llama-3初始版本,包括 8B、70B 以及正在训练的 400B 模型。
Llama-8B 上下文长度为8K,使用15T tokens训练,训练数据截止到2023年3月。整体性能接近 Llama-2-70B,各方面指标超过了 Gemma-7B-it 和 Mistral-7B instruct。
Llama-3-70B 上下文长度为8K,使用15T tokens训练,训练数据截止到2023年12月。在 MMLU 评估基准上得分为 82,而 Mixtral 8x22B 得分为 77, Claude-3-sonnet 得分为 79。llama-3-70B 成为最强开源模型!
Llama-3-400B 目前正在训练中,但是各方面指标显示,该模型已经进入排行榜第一梯队。
Llama-3模型怎么下载和使用?
1. Meta提供了免费服务:
https://www.meta.ai
2. 官方模型权重地址:
8B Instruct:
https://huggingface.co/meta-llama/Meta-Llama-3-8B-Instruct
70B Instruct:
https://huggingface.co/meta-llama/Meta-Llama-3-70B-Instruct
3. GGUF 版本地址:
8B Instruct:
https://huggingface.co/MaziyarPanahi/Meta-Llama-3-8B-Instruct-GGUF
70B Instruct:
https://huggingface.co/MaziyarPanahi/Meta-Llama-3-70B-Instruct-GGUF
4. Ollama 地址:
https://ollama.com/library/llama3
网友评论