帖文详情
avatar
@9hills@x.good.news
Llama3的几个核心点: 1. 本体具备中文能力,对话时需要使用Prompt 以后请使用中文回答 来激发。期待社区的ft版本,估计很快。 2. 70B 性能碾压gpt-3.5-turbo,不足GPT-4。 3. 400B 是dense model,也是目前推理效率最低的模型(GPT-4是220B激活的MoE模型,总参数1.2TB左右)。性能号称和GPT-4持平,数月后放出。 最近国外开源模型真是一个锣鼓喧天,command r plus、mistral 8x22b、llama3,这三个模型已经是国内闭源模型顶尖水平。 400B一旦放出,那就是开源模型碾压国内的闭源模型,当然,写中文古诗的能力估计还不行。
查看详情
0
0
0
@9hills@x.good.news
0/480
加载中