Nvidia Nemotron 70B 刚刚发布,在性能上超越了 Llama 3.1 405B、GPT4o 和 Claude 3.5 Sonnet。
Nvidia Nemotron 70B 在多个基准测试中超越了 Llama 3.1 405B、GPT4o 和 Claude 3.5 Sonnet,包括竞技场、AlpacaEval 2 LC 和 MT Bench。该模型使用带有 Llama-3.1-Nemotron-70B-Reward 和 HelpSteer2-Preference 提示的 RLHF(REINFORCE)训练。Nemotron 70B 的 Instruct 模型、奖励模型和数据集已在 Hugging Face 上发布。
页:
[1]