Leo Xiang
Leo Xiang
机器人 敏感内容@leeoxiang@x.good.news
加入于 · 2024-03-17 04:10:52
Official
本机器人服务由 good.news 提供
已过滤: . 继续显示
@leeoxiang@x.good.news
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
现在借助 claude 以及cursor 写一些工具项目越来越感觉是在玩一个游戏,prompt + copy/paste + 少许的 debug 就可以工作了。
今日份游戏:把 dify api 转换为 openai 协议 api。
t.co/wKg2r4K0A5
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
我们的 RTC AI对话平台默认只支持 openai 协议规范的大模型,借助 claude 和 cursor 把 coze 的 api 转换成 openai 兼容的规范,这样就能把 coze 上的 worklfow 接入到我们 实时对话平台上来。
写代码+写文档半个多小时搞定,整个编程体验非常丝滑。
t.co/pnUeKv55sW
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
在调试一个英语口语练习的 workflow, prompt 中写明了“请始终以英文回复”, 国内大模型测试了:豆包、kimi、百川、minimax 都没法做到只回复英文。
不是都号称能逼近 gpt4 能力了么,prompt 遵循能力还是这么差。
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
0
0
0
已过滤: . 继续显示
已过滤: . 继续显示
@leeoxiang@x.good.news
作为研发写文档的难度高于写代码,最近用 claudeai 帮我写技术文档,我只需要把我想表达的关键内容告诉他,他就帮我生成了一篇很丰富技术文档,再让 claude 根据参数定义生成 demo 代码,整过过程非常丝滑。
继续找 @Cydiar404 给我续了一年的claudeai 订阅。
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
有没有专门实时翻译(同声传译)的大模型?
需求:
1、希望模型比较小,虽然大模型翻译工作做的比较好,希望这个专用的大模型性价比更高;
2、支持的语言种类尽可能能的多;
3、能支持实时的输入输出。
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
发现 Cursor是可以使用自己的api-key的,因为已经购买了 github copilot,暂时没有花 20$订阅,先用一段时间再决定是否要花 20$。
Cursor可以在配置中设置自己的 api-key,设置方案如下:
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
硅基流动提供了 sencevoice-small 语音识别模型的推理服务,限时免费。
支持中、英、粤语、日、韩的识别,一段 10 秒的音频识别耗时在 100-200ms 界别,可以用起来了。
t.co/qZACvjPyyW
0
0
0
已过滤: . 继续显示
已过滤: . 继续显示
@leeoxiang@x.good.news
面壁的这个多模态8B 大模型确实不错,扔一个视频进去,三分钟的视频 十几秒理解完:
1、处理速度能到实时
2、每秒抽取一帧的方式进行处理
3、没有对音频处理,加上音频的理解效果应该更好。
t.co/L2s8n0V9Kv
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
面壁的这个多模态8B 大模型确实不错,扔一个视频进去,三分钟的视频 十几秒理解完:
1、处理速度能到实时
2、每条抽取一帧的方式进行处理
3、没有对音频处理,加上音频的理解效果应该更好。
t.co/L2s8n0VHA3
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
大模型语音对话中的三件套:STT,LLM,TTS
STT: 支持流式输入/流式输出
LLM: 只支持流式输出
TTS: 支持流式输入/流式输出
所以大模型有没有可能支持流式输入?
有些场景还是很需要的,比如:在实时翻译场景,希望流式的输出翻译后的文字,如果大模型能支持流式输入就会很方便。
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
面壁智能今天发布MiniCPM-V 2.6视频多模态大模型
- 性能领先:在单图、多图和视频理解方面声称超越GPT-4V;
- 轻量高效:仅8B参数,优于多个参数量更大的商用闭源模型;
- 端侧部署:能在iPad等设备上实现实时视频理解。
非常期待能做到实时的视频多模态大模型,本周末给出评测结果。
t.co/sCpLgf7W4e
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
客户调用我们的 API 的时候经常传错参数,让Claudeai 帮写了两个快速验证参数的页面,90% 代码是大模型生成,自己再稍微改改加点逻辑,半个小时就跑起来了,接入我们 API 之前先让客户自己验证一下参数是否正确。
省事省力,支持客户的时间也大幅减少了。
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
做流量和做商业转化是两种完全不同的逻辑。
老婆运营视频号经历了两个过程,第一个过程是做流量做内容科普,粉丝做到1w+却基本没有转化。 第二个过程就只关注转化,主打你有病我有药,每条内容中埋下交易的钩子,目前只有 2k 关注,成交转化却异常的好。
你是在做流量还是在做转化呢?
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
万物皆可List, Chief AI Office整理的AI融资大数据,包括:
1、800+轮融资信息,2024年AI行业融资全景图 ,轮次详情 + 投资方信息 ;
2、GPT-4强化版公司简介。
售价 $197 一份。t.co/CIilLWAgyo
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
DeepSeek API 的并发和限流
DeepSeek API 服务按照每天 1 万亿的容量进行设计。对所有用户均不限流、不限并发、同时保证服务质量。请放心加大并发使用。
deepseek 确实不按照常规套路出牌。
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
Deepseek这个API Cache 直接把输入 token 的价格降低了一个数量级, 百万 token 价格到了 0.1 元, 官方列了两个非常契合的场景:
1、对于多轮对话场景,前面的多轮对话都能命中 cache;
2、对于数据分析场景,扔给大模型的大量数据也都能 cache;
另外像长文本对话、代码场景也能节省大量的费用。
0
0
0
已过滤: . 继续显示
@leeoxiang@x.good.news
0
0
0
加载中