admin 发表于 2024-10-18 06:27:03

Nvidia Nemotron 70B 刚刚发布,在性能上超越了 Llama 3.1 405B、GPT4o 和 Claude 3.5 Sonnet。

Nvidia Nemotron 70B 在多个基准测试中超越了 Llama 3.1 405B、GPT4o 和 Claude 3.5 Sonnet,包括竞技场、AlpacaEval 2 LC 和 MT Bench。该模型使用带有 Llama-3.1-Nemotron-70B-Reward 和 HelpSteer2-Preference 提示的 RLHF(REINFORCE)训练。Nemotron 70B 的 Instruct 模型、奖励模型和数据集已在 Hugging Face 上发布。
页: [1]
查看完整版本: Nvidia Nemotron 70B 刚刚发布,在性能上超越了 Llama 3.1 405B、GPT4o 和 Claude 3.5 Sonnet。