Leo Xiang

Leo Xiang

机器人
加入于 · 2024-03-17 04:10:52
avatar
@leeoxiang@x.good.news
语音可能是更适合AI交互的方式一个验证: coze 平台上在学习教育分类中推荐的 12 个应用中,有一半是支持实时语音的。 t.co/SjaQ7ZFrot
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
Coze 的这个画布工作流很强大了,批量生成运营图文太方便。
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
coze 的工作流支持画板了,这个是期待很久的能力。 用这个画板的能力基本上可以复刻 glif @heyglif 上很多玩法。
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
看到 coze 的 plugin 也开始收费了。 后面有没有可能一个个的小 SaaS 变成了Agent 平台的一个个 plugin,根据调用次数进行收费。
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
发现 Cursor是可以使用自己的api-key的,因为已经购买了 github copilot,暂时没有花 20$订阅,先用一段时间再决定是否要花 20$。 Cursor可以在配置中设置自己的 api-key,设置方案如下:
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
继ChatGPT、t.co/PufjzPrSyJ 把 RTC 作为实时语音的交互方案之后,Retellai也转向了WebRTC,国内的各大模型厂商也都会跟进。
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
Grok 已经初步能用了,最近一段时间 twitter上的少,这样的总结能力确实能帮助我不少。
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
面壁的这个多模态8B 大模型确实不错,扔一个视频进去,三分钟的视频 十几秒理解完: 1、处理速度能到实时 2、每秒抽取一帧的方式进行处理 3、没有对音频处理,加上音频的理解效果应该更好。 t.co/L2s8n0V9Kv
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
面壁的这个多模态8B 大模型确实不错,扔一个视频进去,三分钟的视频 十几秒理解完: 1、处理速度能到实时 2、每条抽取一帧的方式进行处理 3、没有对音频处理,加上音频的理解效果应该更好。 t.co/L2s8n0VHA3
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
客户调用我们的 API 的时候经常传错参数,让Claudeai 帮写了两个快速验证参数的页面,90% 代码是大模型生成,自己再稍微改改加点逻辑,半个小时就跑起来了,接入我们 API 之前先让客户自己验证一下参数是否正确。 省事省力,支持客户的时间也大幅减少了。
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
万物皆可List, Chief AI Office整理的AI融资大数据,包括: 1、800+轮融资信息,2024年AI行业融资全景图 ,轮次详情 + 投资方信息 ; 2、GPT-4强化版公司简介。 售价 $197 一份。t.co/CIilLWAgyo
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
本地测试了下 Gemma2 2B,基本的翻译和总结都能胜任,可以用来做一些好玩的应用了。
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
Deepseek这个API Cache 直接把输入 token 的价格降低了一个数量级, 百万 token 价格到了 0.1 元, 官方列了两个非常契合的场景: 1、对于多轮对话场景,前面的多轮对话都能命中 cache; 2、对于数据分析场景,扔给大模型的大量数据也都能 cache; 另外像长文本对话、代码场景也能节省大量的费用。
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
再也不用担心推文封面生成的问题了,折腾了一晚上的推文自动生成封面工作流完成了,效果如下:
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
让Claudeai 帮我实现了一下这两天很火的大字报,两次 prompt 就完成了。 图一是生成的效果图,图二是 Prompt。 需要注意的是需要把claudeai 生成的html 本地运行,用Artifacts预览的时候会报一个沙箱错误。
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
拾象的这篇关于Voice Agent的文章写的非常专业,端到端大模型性并不能真正的解决企业工作流中的问题。 推荐给大家: 《Voice Agent:AI 时代的交互界面,下一代 SaaS 入口》 t.co/p5oUSO3c9A
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
在Llama 3 405B模型54天的预训练期间,总共发生了417 次意外中断,训练过程挑战重重。 主要原因包括: 1、GPU故障: 148次 (30.1%) 2、GPU HBM3内存: 72次 (17.2%) 3、软件Bug: 54次 (12.9%) 4、网络交换机/线缆: 35次 (8.4%) 5、主机维护: 32次 (7.6%) 6、GPU SRAM内存: 19次 (4.5%) 7、GPU系统处理器: 17次 (4.1%) 8、NIC: 7次 (1.7%) 9、NCCL看门狗超时: 7次 (1.7%) 10、静默数据损坏: 6次 (1.4%) 11、GPU热接口+传感器: 6次 (1.4%) 训练大模型仍充满了各种工程上的挑战,向meta致敬。
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
在Llama 3 405B模型54天的预训练期间,总共发生了417次意外中断,训练过程挑战重重。 主要原因包括: 1、GPU故障: 148次 (30.1%) 2、GPU HBM3内存: 72次 (17.2%) 3、软件Bug: 54次 (12.9%) 4、网络交换机/线缆: 35次 (8.4%) 5、主机维护: 32次 (7.6%) 6、GPU SRAM内存: 19次 (4.5%) 7、GPU系统处理器: 17次 (4.1%) 8、NIC: 7次 (1.7%) 9、NCCL看门狗超时: 7次 (1.7%) 10、静默数据损坏: 6次 (1.4%) 11、GPU热接口+传感器: 6次 (1.4%) 训练大模型仍充满了各种工程上的挑战,向meta致敬。
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
Llama 3.1 是一个多模态大模型,支持图片、音频、视频输入。但看起来多模态部分评分并不太高,图片和视频部分相比 gpt-4o 有一些差距,音频理解部分对比 whisper 有不小差距。 多模态部分看起来还不是 Llama 3.1 的重心。
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
ElevenLabs 已经不只是一家tts技术服务商了,陆续推出了Dubbing studio、Voiceover Studio、Voice Isolator声音分离工具,开始往产品方向转型。
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
如果要做 RTC 跟 大模型的实时交互,TTFT 以及 TPS 非常关键。 今天在 SiliconFlow上整体评测了一下各个模型的 TTFT和 TPS,供大家参考。 TTFT: 首Token 耗时。 TPS: 每秒 Token数。
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
如果要做 RTC 跟 大模型的实时交互,TTFT 以及 TPS 非常关键。 今天在SiliconFlow 上整体评测了一下各个模型的 TTFT和 TPS,供大家参考。 TTFT: 首Token 耗时。 TPS: 每秒 Token数。
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
阿里也开源了一个 agent 开发平台,阿里选择了用开源的方式来培育生态。 t.co/egv3az4Ewr
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
两个 voice agent 产品都新增了 workflow 的设计,左边是t.co/aa5ztoPt12,右边是t.co/ZIautQuzhR
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
agent101 的前四个教程已经更新完毕,详细的教程和 workflow 可以在 t.co/l4BDLbinbB 查看: 1、AISearch:打造专属的 AI搜索助理 t.co/6QB13bHx2L 2、Trans Ninja: 复现吴恩达老师的 AI 翻译工作流 t.co/2aspgRE7Ah 3、Tweet Hunter:抓取 X/Twitter 热点内容 t.co/QMlnfZjfwe 4、AI Article Writer: 将 Youtube 视频转写为 SEO 友好的文章 t.co/EHMoMjHWC5
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
coze 国内版本也开始收费计划,不过这个免费版本比 coze海外版本要宽松一些。 t.co/k9yvlr7NEN
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
Canva 有个 autofill 的 API非常好用,你创建一个 canva 的模版以后就可以通过 API 来进行文字和图片的替换和渲染,配合 大模型批量出图非常方便。 不过这个autofill API 只开放给企业客户,不知道有没有其他的替代方案? t.co/tWnFSMd3cw
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
AI Article Writer -- 将YouTube视频改写为SEO友好的文章Workflow发布了,依旧是 workflow和代码公开访问。 Workflow地址: t.co/XvqaXKuYQt 教程:t.co/SYCAE5CCMT #Agent101
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
这两年买的耳机,自从戴AirpodPro导致中耳炎之后就跟入耳式的耳机说拜拜了,目前带着最舒服的华为的这款FreeClip开放式耳机 。
查看详情
0
0
0
avatar
@leeoxiang@x.good.news
看marscode 提供的 AI Plugin 能力,可以直接生成代码,而且可以直接部署,看接口规范还能和 coze 的 plugin 直接打通,生态的力量确实强大。
查看详情
0
0
0
加载中