歸藏(guizang.ai)
歸藏(guizang.ai)
Robot Sensitive content@op7418@x.good.news
Joined in · 2024-03-16 13:09:27
Official
本机器人服务由 good.news 提供
Filtered: . Continue to show
@op7418@x.good.news
Filtered: . Continue to show
@op7418@x.good.news
今天发现我自己常用来启动 ComfyUI 的云服务平台揽睿星舟进行了一波大升级。
现在启动之后就可以使用 comfyui,内置了常见的插件和模型,直接就跑,没有充了钱还得排队这一说。
之前很复杂的服务启动流程也被自动化了,阻挡小白用户最麻烦的一步也被搞定了。
也可以直接把 ComfyUI 工作流包装成应用来给用户提供服务。
嫌自己本地部署 Comfyui 麻烦的朋友可以试试:t.co/5FEJKJ2i3B
现在启动之后就可以使用 comfyui,内置了常见的插件和模型,直接就跑,没有充了钱还得排队这一说。
之前很复杂的服务启动流程也被自动化了,阻挡小白用户最麻烦的一步也被搞定了。
也可以直接把 ComfyUI 工作流包装成应用来给用户提供服务。
嫌自己本地部署 Comfyui 麻烦的朋友可以试试:t.co/5FEJKJ2i3B
Filtered: . Continue to show
@op7418@x.good.news
Filtered: . Continue to show
@op7418@x.good.news
收到了豆包的 Ola Friend 耳机,试了一下还挺强的,比宣传片能做的事情多多了。
比如你可以随时记录想记录的内容然后让豆包进行加工和整理,然后直接把对话收藏就行。
基本就是一个加强版随时唤醒的 Voicenote,日常习惯了语音记录的话成本很低,很多想法都可以被捕捉和记录。
其他的功能有:
- 不是非得说豆包豆包才能唤醒,点一下也行。
- 说豆包豆包是连续对话,点一下是回合制。
- 收音效果很好,基本很小声它也能听到,周围人只能看到你嘴在动。
- 支持跟汽水音乐联动,播放对应歌单之类的。
- 豆包的音频自然度应该是国内最好的,非常自然,同事试了一下非常喜欢说没有 AI 感。
比如你可以随时记录想记录的内容然后让豆包进行加工和整理,然后直接把对话收藏就行。
基本就是一个加强版随时唤醒的 Voicenote,日常习惯了语音记录的话成本很低,很多想法都可以被捕捉和记录。
其他的功能有:
- 不是非得说豆包豆包才能唤醒,点一下也行。
- 说豆包豆包是连续对话,点一下是回合制。
- 收音效果很好,基本很小声它也能听到,周围人只能看到你嘴在动。
- 支持跟汽水音乐联动,播放对应歌单之类的。
- 豆包的音频自然度应该是国内最好的,非常自然,同事试了一下非常喜欢说没有 AI 感。
Filtered: . Continue to show
@op7418@x.good.news
快手和北大开源了一个基于流匹配的自回归视频生成模型 Pyramidal Flow Matching。
演示视频看起来效果非常好。
所有的数据都来源于开源数据集;
可以生成 768P、10 秒 24FPS 的视频;
总参数量为 2B。
演示视频看起来效果非常好。
所有的数据都来源于开源数据集;
可以生成 768P、10 秒 24FPS 的视频;
总参数量为 2B。
Filtered: . Continue to show
@op7418@x.good.news
试了一下智谱新发布的基于思维链的AI搜索,有点🐂🍺的。
前几周Open AI 发布O1和O1 mini之后,基本上大家都看到了思维链和模型推理能力的价值,对于事实核查以及复杂问题的解决有非常大的作用。
而这类解决方案除了帮助科学家和开发者之外,离普通用户最近的需求就是搜索了。
推理能力和长文本阅读可以大幅解决之前AI搜索的幻觉问题,另外可以对搜索结果进行复杂总结给出更深入和准确的结果,节约整理和一定的逻辑推理成本。
智谱新发布的AI搜索就结合了网页深度阅读和多步推理能力,可以实现:
- 可以支持单次阅读超过100多个网页;
- 支持多级推理的思维链;
- 可以联动智谱其他的AI工具
你可以在多步复杂内容上增加需要计算的问题,比如这个每天吃5个苹果的热量占正常人类消耗的百分之多少。
推理能力的最好提现是你可以在一个问题中询问多个逻辑相关的问题他都能给出回答,比如这里询问二战密码破译机的发明者以及他的贡献以及对AI的影响。
除了能整理内容之外核心是可以对内容进行一定处理,比如下面截图里面的A股历史牛市分析它可以深入阅读网页信息并且给出对应的表格,之后还可以用Python画出对应的图表。
最后是终极问题,之前的AI搜索即使我降低难度问AI领域的歸藏是谁很多都答不对,开始给我介绍歸藏易,智谱回答和介绍的非常好。
智谱“AI搜索”智能体已经正式上线,感兴趣可以试试。
前几周Open AI 发布O1和O1 mini之后,基本上大家都看到了思维链和模型推理能力的价值,对于事实核查以及复杂问题的解决有非常大的作用。
而这类解决方案除了帮助科学家和开发者之外,离普通用户最近的需求就是搜索了。
推理能力和长文本阅读可以大幅解决之前AI搜索的幻觉问题,另外可以对搜索结果进行复杂总结给出更深入和准确的结果,节约整理和一定的逻辑推理成本。
智谱新发布的AI搜索就结合了网页深度阅读和多步推理能力,可以实现:
- 可以支持单次阅读超过100多个网页;
- 支持多级推理的思维链;
- 可以联动智谱其他的AI工具
你可以在多步复杂内容上增加需要计算的问题,比如这个每天吃5个苹果的热量占正常人类消耗的百分之多少。
推理能力的最好提现是你可以在一个问题中询问多个逻辑相关的问题他都能给出回答,比如这里询问二战密码破译机的发明者以及他的贡献以及对AI的影响。
除了能整理内容之外核心是可以对内容进行一定处理,比如下面截图里面的A股历史牛市分析它可以深入阅读网页信息并且给出对应的表格,之后还可以用Python画出对应的图表。
最后是终极问题,之前的AI搜索即使我降低难度问AI领域的歸藏是谁很多都答不对,开始给我介绍歸藏易,智谱回答和介绍的非常好。
智谱“AI搜索”智能体已经正式上线,感兴趣可以试试。
Filtered: . Continue to show
@op7418@x.good.news
最近 FLUX 生成擦边视频和网红图看起来很火啊。
其实我有个比较成体系的网红图生成方案。
主要是一些保证正式感的参数和流程,还有一些保证擦边内容质量的东西。
之前的问题是已有的视频模型面部表情过于僵硬,海螺刚好解决了这个问题。
看看要不要整理一下。
其实我有个比较成体系的网红图生成方案。
主要是一些保证正式感的参数和流程,还有一些保证擦边内容质量的东西。
之前的问题是已有的视频模型面部表情过于僵硬,海螺刚好解决了这个问题。
看看要不要整理一下。
Filtered: . Continue to show
Filtered: . Continue to show
@op7418@x.good.news
Filtered: . Continue to show
@op7418@x.good.news
Filtered: . Continue to show
@op7418@x.good.news
Filtered: . Continue to show
@op7418@x.good.news
把给他爱 4 的游戏视频用 Runway V2V 转成更加写实的视频,让老游戏焕发新生。
感觉以后 AI 重绘加低模 3D 渲染可能是新的游戏实现路径。
现在英伟达的帧生成功能已经在做类似的事情了,不过没这么激进。
Filtered: . Continue to show
@op7418@x.good.news
Filtered: . Continue to show
@op7418@x.good.news
即友 Figo.L 非常成熟的 APP Demo,输入文章链接生成播客。
主要是播放页实时展示对应文本而且可以收藏这个很强。
充分发挥了 AI 的优势,所有的音频都是图文版本,每一句话都可以被检索和重组。
Filtered: . Continue to show
@op7418@x.good.news
即友 Figo.L 非常成熟的 APP Demo,输入链接生成播客。
主要是播放页实时展示对应文本而且可以收藏这个很强。
充分发挥了 AI 的优势,所有的音频都是图文版本,每一句话都可以被检索和重组。
Filtered: . Continue to show
@op7418@x.good.news
levelsio 为自己的 AI 照片生成产品 photo ai 加上了可灵 API 来生成视频。
看起来效果确实非常好,这种视频加一个唇形同步和 tts 就可以搞 ai 广告工作流了。
Filtered: . Continue to show
Filtered: . Continue to show
Filtered: . Continue to show
@op7418@x.good.news
Filtered: . Continue to show
Filtered: . Continue to show
@op7418@x.good.news
终于有个产品把 AI 代码生成这一套做全了。
StackBlitz 推出 bolt. new,可以看作 Artfacts V0 和 Replit 的结合体。
支持提示、编辑、部署的全栈流程
带有完整的开发环境
可以实时预览生产结果。
最重要的是免费。
Filtered: . Continue to show
@op7418@x.good.news
Filtered: . Continue to show
@op7418@x.good.news
Filtered: . Continue to show
@op7418@x.good.news
格拉斯哥大学发的一篇《学习 101》很有意思,主要教人们如何更好的学习。
详细介绍了七种学习障碍,并且每个类型都给出了多个补救的方法。
针对有效学习也给了更多建议,比如间隔学习、交错学习等学习方式。
Filtered: . Continue to show
Filtered: . Continue to show
@op7418@x.good.news
卧槽,卷起来了,字节今天限量开放 P 模型。
可灵直接发布对口型能力,不是正方形脸部,可以直接在生成的视频对口型。
而且全量开放了 API 能力,图片、视频、虚拟试穿全部上线,充钱就能用。
有类似产品规划的朋友可以冲了,下面是官方演示。
Filtered: . Continue to show
Filtered: . Continue to show
@op7418@x.good.news
智谱开源了他们的图像生成模型 CogView3 以及 CogView-3Plus-3B 。
CogView3 是一个基于级联扩散模型,CogView-3Plus-3B 是一个 DiT 图片模型。
之前他们的说CogView3 的表现优于 SDXL,获胜率达到 77.0%。
而且生成时间只有 SDXL 的十分之一,CogView-3Plus-3B的测试结果还没发。
项目地址:t.co/xLMQo3rSqY
Filtered: . Continue to show
@op7418@x.good.news
Filtered: . Continue to show
@op7418@x.good.news
昨晚两篇关于 OpenAI 的报道很有意思。
纽约时报拿到了OpenAI 融资的文件,里面有相当详细的数据披露。
WSJ 关于 OpenAI 高管动荡风波的一些内幕。
下面是一些核心内容:
Open AI 25 年收入会达到 116亿美元,想逐步将订阅费提高到 44 美元。
Ilya 没有回来和 Brockman 的作风对士气影响挺大的。
Loading...