九原客

九原客

机器人
加入于 · 2024-03-18 02:02:03
avatar
@9hills@x.good.news
PDF 转 Markdown 工具列表:
查看详情
0
0
0
avatar
@9hills@x.good.news
最新支持中文的开源模型个人向推荐(不同参数规模的)。
查看详情
0
0
0
avatar
@9hills@x.good.news
What We Learned from a Year of Building with LLMs 的中文翻译 《大模型产品化第一年​:战术、运营与战略》 这篇文章很务实,做企业大模型应用的强烈推荐。 t.co/wAcnmhqgKK
查看详情
0
0
0
avatar
@9hills@x.good.news
大模型国内乱象之行业大模型。 可以观赏神文《中国杀出全球首个烹饪大模型》,简直就是各种名词的堆叠: 食神大模型的赋能,是一个连续多场景过程 / 跨设备协同和规划 / 多模态数据的感知、多模态的交互以及与多个设备的协同联动等多个层面的能力 t.co/nhDSvZ6xqD
查看详情
0
0
0
avatar
@9hills@x.good.news
教训:不要和老前辈犟嘴,尤其是你在用人家发明的东西。不过我猜马斯克下的人应该不会在汇报材料里放CNN这种基础的东西,而是写一些高大上点的词汇,导致马斯克没啥概念。 网友笑话:特斯拉的xAI团队正在加班从FSD中移除卷积神经网络。
查看详情
0
0
0
avatar
@9hills@x.good.news
找到一个弱智吧的数据集:t.co/SUAlQy8Tfn 看来以后训模型要加一些这些题目了~
查看详情
0
0
0
avatar
@9hills@x.good.news
看论文看到哈哈大笑,用「弱智吧」标题+GPT-4回答微调后的Yi-34B模型评估结果超过了精心收集的 SFT 指令集数据,安全性评估也是第二名。 弱智吧就是百度弱智吧,里面的帖子是这种画风:「既然监狱里全是罪犯,👮♀️为什么不去监狱里抓人?」 论文:t.co/VKn5sGEmCu
查看详情
0
0
0
avatar
@9hills@x.good.news
Claude 3 Opus + ChainForge,明显提升了 Prompt 编写效率。工作流: 1. 手动编写测试用例种子和原始 Prompt。 2. 让 Claude 3 根据 Prompt和种子,生成大量测试用例。 3. 在 ChainForge 上构建 workflow,尤其是测试。 4. 让 Claude 3 迭代 Prompt。 5. 不断的测试,拿到最好的效果。
查看详情
0
0
0
avatar
@9hills@x.good.news
简直太聪明了,发现了大模型的痛点。但是你推崇的通义千问,连几百个字符都数不清楚。 对大语言模型的原理完全不清楚,只知道把它看作一个黑盒,靠玄学 Prompt 在上面调优,就不要出来丢人现眼了。
查看详情
0
0
0
没有更多数据了