开源大模型Llama 3王者归来，性能直逼GPT-4！

扎克伯格：「有了 Llama 3，全世界就能拥有最智能的 AI。」

ChatGPT 拉开了大模型竞赛的序幕，Meta 似乎要后来居上了。

上周四，AI 领域迎来重大消息，Meta 正式发布了人们等待已久的开源大模型 Llama 3。

与此同时，扎克伯格宣布：基于最新的 Llama 3 模型，Meta 的 AI 助手现在已经覆盖 Instagram、WhatsApp、Facebook 等全系应用，并单独开启了网站。另外还有一个图像生成器，可根据自然语言提示词生成图片。

扎克伯格表示，Meta 提供的生成式 AI 能力在免费产品中性能是最强大的。

去年 9 月推出的Meta AI 助手现已集成到 Instagram、Facebook、WhatsApp 和 Messenger 的搜索框中。它还将开始直接出现在 Facebook 的主要动态中。您仍然可以在 Meta 应用程序的消息收件箱中与它聊天。现在第一次可以通过 Meta.ai 的独立网站访问它。

Meta 的助手要想成为真正的 ChatGPT 竞争对手，底层模型必须同样好，甚至更好。这就是 Meta 还宣布 Llama 3 的原因，这是其基础开源模型的下一个主要版本。 Meta 表示，Llama 3 在关键基准测试中的表现优于同类竞争模型，并且在编码等任务方面表现更出色。今天，Meta AI 助手和外部开发人员都发布了两款较小的 Llama 3 模型，而更大的多模式版本将在未来几个月内推出。

首席执行官马克扎克伯格说，Meta AI 的目标是成为“世界各地人们可以自由使用的最智能的人工智能助手”。 “有了 Llama 3，我们基本上就感觉身临其境。”

Meta AI 助手是我所知道的唯一一个集成了 Bing 和 Google 实时搜索结果的聊天机器人——Meta 决定何时使用任一搜索引擎来回答提示。它的图像生成功能也已升级，可以创建动画（本质上是 GIF），并且现在可以在您键入时即时生成高分辨率图像。与此同时，当你第一次打开聊天窗口时，受 Perplexity 启发的提示面板旨在“揭开通用聊天机器人的功能”，Meta 的生成人工智能主管 Ahmad Al-Dahle 说道。

简而言之，Llama 3 的主要亮点包括：

基于超过 15T token 训练，相当于 Llama 2 数据集的 7 倍还多；
支持 8K 长文本，改进的 tokenizer 具有 128K token 的词汇量，可实现更好的性能；
在大量重要基准中均具有最先进性能；
新能力范畴，包括增强的推理和代码能力；
训练效率比 Llama 2 高 3 倍；
带有 Llama Guard 2、Code Shield 和 CyberSec Eval 2 的新版信任和安全工具。

Llama 3，性能重回王座

最新发布的 8B 和 70B 参数的 Llama 3 模型可以说是 Llama 2 的重大飞跃，由于预训练和后训练（Post-training）的改进，本次发布的预训练和指令微调模型是当今 8B 和 70B 参数规模中的最佳模型。与此同时，后训练过程的改进大大降低了模型出错率，进一步改善了一致性，并增加了模型响应的多样性。

Llama 3 将数据和规模提升到新的高度。Meta 表示，Llama 3 是在两个定制的 24K GPU 集群上、基于超过 15T token 的数据上进行了训练 —— 相当于 Llama 2 数据集的 7 倍还多，代码数据相当于 Llama 2 的 4 倍。从而产生了迄今为止最强大的 Llama 模型，Llama 3 支持 8K 上下文长度，是 Llama 2 容量的两倍。

此外，Meta 还开发了一套新的高质量人类评估数据集。该评估集包含 1800 个提示，涵盖 12 个关键用例：寻求建议、头脑风暴、分类、封闭式问答、编码、创意写作、提取、塑造角色、开放式问答、推理、重写和总结。为了防止 Llama 3 在此评估集上出现过度拟合，Meta 表示他们自己的团队也无法访问该数据集。下图显示了针对 Claude Sonnet、Mistral Medium 和 GPT-3.5 对这些类别和提示进行人工评估的汇总结果。

下图是 Llama 3 预训练模型和其他同等规模模型的比较，前者表现出 SOTA 水平。

Llama 3 是一个很好的例子，说明了这些人工智能模型的扩展速度有多快。扎克伯格表示，去年发布的 Llama 2最大版本拥有 700 亿个参数，而即将推出的 Llama 3 大型版本将拥有超过 4000 亿个参数。 Llama 2 使用 2 万亿个 token（本质上是构成模型的单词或具有基本含义的单位）进行训练，而 Llama 3 的大版本拥有超过 15 万亿个 token。（OpenAI 尚未公开确认 GPT-4 中的参数或代币数量。）

Llama 3 的一个重点是有意义地减少其错误拒绝的次数，即模型说它无法回答实际上无害的提示的次数。扎克伯格提供的一个例子是要求它制作“杀手玛格丽塔”。

下一步是什么？

8B 和 70B 两个型号的模型，标志着 Llama 3 系列的开端，下一步还会有更多。

Meta 表示，「最大的 Llama 3」参数超过 400B，虽然这些机型仍在训练中，但在接下来的几个月中也将陆续发布，新功能包括多模态、多语言对话能力、更长的上下文窗口以及更强的整体能力。

一旦完成 Llama 3 的训练，Meta 还将发表一篇详细的研究论文。

人工智能模型的变革步伐如此之快，即使 Meta 目前凭借 Llama 3 重新跻身开源排行榜榜首，谁知道明天会发生什么。据传OpenAI正在准备 GPT-5，这可能会再次超越业界其他公司。当我向扎克伯格询问此事时，他说 Meta 已经在考虑 Llama 4 和 5。对他来说，这是一场马拉松，而不是短跑。

“目前，我们的目标不是与开源模型竞争，”马克说。 “这是为了与世界上的一切竞争，并成为世界领先的人工智能。”

也许只有 OpenAI 的 GPT-5 才能压下开源模型了。

服务类型	教程
ChatGPT Plus	2024年升级ChatGPT Plus最详细图文教程 2024年手把手教你升级 ChatGPT Plus 2024年教你使用电子邮箱轻松注册chatgpt账号 ChatGPT 无法登录提示「Unable to load site」怎么办？
Claude 3	Claude 3 打响科技“军备”竞赛之一——【什么是 Claude 3？】 Claude 3 打响科技“军备”竞赛之二——【如何升级 Claude 3？】
Apple ID【美区】	苹果手机如何注册美区Apple ID并绑卡（解决支付问题）？
Onlyfans	2024年手把手教你使用虚拟信用卡订阅 Onlyfans
Midjourney	什么是 Midjourney 以及如何订阅 Midjourney？
OpenAI Sora	What is OpenAI Sora?–小白必看
YouTube	【2024】如何订阅 YouTube Premium 会员服务？
Gmail谷歌邮箱	【2024】如何注册Gmail谷歌邮箱？