Leo Xiang 的媒体 - leeoxiang@x.good.news

Deepseek这个API Cache 直接把输入 token 的价格降低了一个数量级，百万 token 价格到了 0.1 元，官方列了两个非常契合的场景： 1、对于多轮对话场景，前面的多轮对话都能命中 cache； 2、对于数据分析场景，扔给大模型的大量数据也都能 cache；另外像长文本对话、代码场景也能节省大量的费用。

查看详情

Leo Xiang

leeoxiang@x.good.news ·

@leeoxiang@x.good.news

再也不用担心推文封面生成的问题了，折腾了一晚上的推文自动生成封面工作流完成了，效果如下：

查看详情

Leo Xiang

leeoxiang@x.good.news ·

@leeoxiang@x.good.news

让Claudeai 帮我实现了一下这两天很火的大字报，两次 prompt 就完成了。图一是生成的效果图，图二是 Prompt。需要注意的是需要把claudeai 生成的html 本地运行，用Artifacts预览的时候会报一个沙箱错误。

查看详情

Leo Xiang

leeoxiang@x.good.news ·

@leeoxiang@x.good.news

拾象的这篇关于Voice Agent的文章写的非常专业，端到端大模型性并不能真正的解决企业工作流中的问题。推荐给大家：《Voice Agent：AI 时代的交互界面，下一代 SaaS 入口》 t.co/p5oUSO3c9A

查看详情

Leo Xiang

leeoxiang@x.good.news ·

@leeoxiang@x.good.news

在Llama 3 405B模型54天的预训练期间，总共发生了417 次意外中断，训练过程挑战重重。主要原因包括: 1、GPU故障: 148次 (30.1%) 2、GPU HBM3内存: 72次 (17.2%) 3、软件Bug: 54次 (12.9%) 4、网络交换机/线缆: 35次 (8.4%) 5、主机维护: 32次 (7.6%) 6、GPU SRAM内存: 19次 (4.5%) 7、GPU系统处理器: 17次 (4.1%) 8、NIC: 7次 (1.7%) 9、NCCL看门狗超时: 7次 (1.7%) 10、静默数据损坏: 6次 (1.4%) 11、GPU热接口+传感器: 6次 (1.4%) 训练大模型仍充满了各种工程上的挑战，向meta致敬。

查看详情

Leo Xiang

leeoxiang@x.good.news ·

@leeoxiang@x.good.news

在Llama 3 405B模型54天的预训练期间，总共发生了417次意外中断，训练过程挑战重重。主要原因包括: 1、GPU故障: 148次 (30.1%) 2、GPU HBM3内存: 72次 (17.2%) 3、软件Bug: 54次 (12.9%) 4、网络交换机/线缆: 35次 (8.4%) 5、主机维护: 32次 (7.6%) 6、GPU SRAM内存: 19次 (4.5%) 7、GPU系统处理器: 17次 (4.1%) 8、NIC: 7次 (1.7%) 9、NCCL看门狗超时: 7次 (1.7%) 10、静默数据损坏: 6次 (1.4%) 11、GPU热接口+传感器: 6次 (1.4%) 训练大模型仍充满了各种工程上的挑战，向meta致敬。

查看详情

Leo Xiang

leeoxiang@x.good.news ·

@leeoxiang@x.good.news

Llama 3.1 是一个多模态大模型，支持图片、音频、视频输入。但看起来多模态部分评分并不太高，图片和视频部分相比 gpt-4o 有一些差距，音频理解部分对比 whisper 有不小差距。多模态部分看起来还不是 Llama 3.1 的重心。

查看详情

Leo Xiang

leeoxiang@x.good.news ·

@leeoxiang@x.good.news

ElevenLabs 已经不只是一家tts技术服务商了，陆续推出了Dubbing studio、Voiceover Studio、Voice Isolator声音分离工具，开始往产品方向转型。

查看详情

Leo Xiang

leeoxiang@x.good.news ·

@leeoxiang@x.good.news

如果要做 RTC 跟大模型的实时交互，TTFT 以及 TPS 非常关键。今天在 SiliconFlow上整体评测了一下各个模型的 TTFT和 TPS，供大家参考。 TTFT: 首Token 耗时。 TPS: 每秒 Token数。

查看详情

Leo Xiang

leeoxiang@x.good.news ·

@leeoxiang@x.good.news

如果要做 RTC 跟大模型的实时交互，TTFT 以及 TPS 非常关键。今天在SiliconFlow 上整体评测了一下各个模型的 TTFT和 TPS，供大家参考。 TTFT: 首Token 耗时。 TPS: 每秒 Token数。

查看详情

Leo Xiang

leeoxiang@x.good.news ·

@leeoxiang@x.good.news

阿里也开源了一个 agent 开发平台，阿里选择了用开源的方式来培育生态。 t.co/egv3az4Ewr

查看详情

Leo Xiang

leeoxiang@x.good.news ·

@leeoxiang@x.good.news

两个 voice agent 产品都新增了 workflow 的设计，左边是t.co/aa5ztoPt12，右边是t.co/ZIautQuzhR。

查看详情

Leo Xiang

leeoxiang@x.good.news ·

@leeoxiang@x.good.news

agent101 的前四个教程已经更新完毕，详细的教程和 workflow 可以在 t.co/l4BDLbinbB 查看： 1、AISearch：打造专属的 AI搜索助理 t.co/6QB13bHx2L 2、Trans Ninja: 复现吴恩达老师的 AI 翻译工作流 t.co/2aspgRE7Ah 3、Tweet Hunter：抓取 X/Twitter 热点内容 t.co/QMlnfZjfwe 4、AI Article Writer: 将 Youtube 视频转写为 SEO 友好的文章 t.co/EHMoMjHWC5

查看详情