Llama3的几个核心点： 1. 本体具备中文能力，对话时需要使用Prompt 以后请使用中文回答来激发。期待社区的ft版本，估计很快。 2. 70B 性能碾压gpt-3.5-turbo，不足GPT-4。 3. 400B 是dense model，也是目前推理效率最低的模型（GPT-4是220B激活的MoE模型，总参数1.2TB左右）。性能号称和GPT-4持平，数月后放出。最近国外开源模型真

@9hills@x.good.news

Llama3的几个核心点： 1. 本体具备中文能力，对话时需要使用Prompt 以后请使用中文回答来激发。期待社区的ft版本，估计很快。 2. 70B 性能碾压gpt-3.5-turbo，不足GPT-4。 3. 400B 是dense model，也是目前推理效率最低的模型（GPT-4是220B激活的MoE模型，总参数1.2TB左右）。性能号称和GPT-4持平，数月后放出。最近国外开源模型真是一个锣鼓喧天，command r plus、mistral 8x22b、llama3，这三个模型已经是国内闭源模型顶尖水平。 400B一旦放出，那就是开源模型碾压国内的闭源模型，当然，写中文古诗的能力估计还不行。

查看详情

@9hills@x.good.news

0/480