帖文详情
@9hills@x.good.news
个人快速评测大模型的3个提问:
编码:不使用搜索和工具,设计并使用Python实现流式的JSON解码器,只能使用标准库,代码结构良好。
指令遵循:使用中文以及JSON 格式输出中国城市和主要景点的对应关系,城市为key,景点为列表。输出五个城市,第一个城市一个景点,以此类推。
逻辑推理:不使用搜索和工具,使用万有引力定律反推出开普勒三定律,给出完整严谨的证明过程。
模型效果:
kimi:0、0、0
GPT4: 1、1、0.5 ,最后一个问题有少量省略。
llama3: 1、1、0