小互
小互
机器人 敏感内容@imxiaohu@x.good.news
加入于 · 2024-03-17 07:36:28
Official
本机器人服务由 good.news 提供
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
卡内基梅隆大学数学系教授、美国数学奥林匹克竞赛国家队教练Po-Shen Loh,在看完Google Deepmind AI参加国际数学奥林匹克比赛并亲自尝试了竞赛题目后发表感慨:
“人类需要进入高度戒备状态!”
在今年的国际数学奥林匹克竞赛(IMO)中,Google Deepmind的人工智能(AI)表现出了接近国际数学奥林匹克竞赛银牌的能力。
卡内基梅隆大学(Carnegie Mellon University)数学系的教授、美国国际数学奥林匹克(IMO)队的国家教练 @PoShenLoh 表达了对AI在国际数学奥林匹克竞赛中取得重大突破的惊讶和担忧。他甚至将这以突破与苏联1957年发射的第一颗人造卫星:斯普特尼克号相提并论。
他称:“当人们看到 1957 年的人造卫星时,他们可能会有和我现在一样的感觉,人类需要进入高度戒备状态!”
他强调,AI不仅能通过模式匹配解决标准化测试,还展示了发现问题解决途径的能力。为了应对AI的快速进步,人类需要提升自己的智力,教育体系也需做出相应调整,培养学生解决新问题的能力。
此外,他主张建立合作而非竞争的社区,以维护人类文明的本质。
他的详细观点:t.co/3VKFVhDHfL
![](/images/bg-white.png)
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
微软 Azure 宣布了一系列更新
推出Phi-3无服务器微调
支持OpenAI (GPT-4o mini)、Meta (Llama 3.1 405B) 和 Mistral (Large 2) 等1600个模型
详细内容:t.co/ixrQz7PVwi
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
弗吉尼亚州国会议员詹妮弗·韦克斯顿因患有罕见的神经系统疾病进行性核上性麻痹,导致她失去了说话和行动能力。
为了继续履行她的职责,她使用了AI克隆她的声音。
韦克斯顿成为第一个在众议院使用AI语音克隆进行演讲的人。t.co/wKA6FLpCNN
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
OpenAI 推出 SearchGPT
将 AI 与实时网络信息结合 提供生成式UI结果
SearchGPT 结合网络最新信息可以直接回答你的问题,同时注明相关来源链接。
你还可以像与人对话一样提出后续问题,每次查询都会构建共享的上下文。
从演示画面来看和普通AI搜索差距不大,但是标志着GPT迈入了生成式UI时代。
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
体育项目运动跟踪技术⚽️
RoboflowSports :跟踪检测和识别运动员行为 提供比赛实时分析
通过精确的对象检测和图像分割技术,提供更高精度的体育数据分析,帮助教练和分析师更好地了解比赛情况和运动员表现。
主要功能:
1. 对象检测
• 足球运动员检测:检测和识别足球运动员。
• 足球检测:识别和跟踪足球的位置。
2. 图像分割:识别并分割图像中的不同对象,例如运动员和足球,提供更精细的图像分析。
3.关键点检测
• 运动员关键点检测:检测运动员身体的关键点位置(如关节),用于姿态估计和动作分析。
• 足球场关键点检测:识别足球场上的关键点,帮助进行战术分析和场地管理。
4.可视化工具:提供用于结果展示的可视化工具,如生成可视化标注的图像和视频。
详细内容:t.co/8deoQHmcVo
GitHub:t.co/QjlQMu6ojV
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
Bing 推出生成式AI搜索功能
根据用户的查询提供量身定制的动态响应结果
生例如,当用户搜索特定主题时,Bing会生成深入的AI驱动的解释,涵盖历史、起源、顶级示例等内容。
例如,当用户搜索“什么是意大利西部片?”时,Bing 会显示一个AI生成的体验,深入探讨电影子类型的历史和起源、顶级示例等。
详细内容:t.co/N5rxjwVBiE
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
SpeechGPT2:一个端到端的语音对话语言模型
类似于 GPT-4o 能够感知和表达情感
该项目由复旦大学计算机学院开发
它能够感知和表达情感,并根据上下文和人类指令提供多种风格的语音响应,如说唱、戏剧、机器人、搞笑和低语等。
超过10万小时的学术和野外收集的语音数据, 涵盖了丰富的语音场景和风格。
SpeechGPT2 是在有限资源下的技术探索,由于计算和数据资源的限制,它在语音理解的噪声鲁棒性和语音生成的音质稳定性方面仍有一些不足。
目前仍在开发中,团队计划未来开源技术报告、代码和模型权重。
详细内容及更多演示:t.co/b4fvD0jiTF
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
Meta AI 研究员:网络上的文本基本都是“狗屎”
Llama 3 没有使用任何人类书写的答案 全是合成数据
Latent Space采访了 Meta AI 研究员 Thomas Scialom,他领导了 Llama2 和现在的 Llama3 训练后工作。
他们详细讨论了Llama 3.1预训练(如合成数据、数据管道、缩放法则等)和后训练(如强化学习人类反馈 (RLHF) 与指令调优、评估、工具调用)方面的内容。
据 Thomas Scialom:
1. 合成数据:
- 我的直觉是,网络上的文本都是狗屎,在这些标记上进行训练是在浪费计算量"。
- Llama 3 后期训练没有使用任何人类书写的答案,而是完全依赖于Llama 2生成的纯合成数据。”
2. 合成数据的具体应用:
- 代码生成:使用三种方法生成代码合成数据,包括代码执行反馈、编程语言翻译和文档反向翻译。
-数学推理:借鉴了“让我们逐步验证"作者的研究,进行合成数据生成。
-多语言处理:通过90%的多语言令牌继续预训练,收集高质量的人类注释。
- 长文本处理:依赖于合成数据来处理长文本的问答、长文档摘要和代码库推理。
- 工具使用:在Brave搜索、Wolfram Alpha和Python解释器上训练进行单次、嵌套、并行和多轮函数调用。
3. 强化学习与人类反馈(RLHF):
- 广泛使用人类偏好数据进行模型训练。
- 强调了人类在两者之间进行选择(如选择两首诗中更喜欢哪一首)而非创作(从零开始写一首诗)的能力。
4. Meta 已经在6 月份开始训练Llama 4,听起来一大重点将是围绕智能体展开。
5.多模态版本将有更多参数,稍后发布
详细内容:t.co/XecY9NXVGi
![](/images/bg-white.png)
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
Open-Sora Plan v1.2.发布
引入新的3D全注意力架构,提升了对物理世界的理解能力。
改进了从文本生成视频的能力。
通过新架构和优化的VAE结构,提升了视频生成的清晰度和一致性。
新的3D全注意力架构解决了之前版本无法同时处理空间和时间维度的问题。
优化后的CausalVideoVAE结构提高了模型的推理速度和性能。
Open-Sora致力于复刻OpenAI Sora模型...
GitHub:t.co/PzQlp40NAD
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
Adobe 发布Firefly Vector AI 模型
为 Illustrator 和 Photoshop 推出更多生成式 AI 功能
Adobe Illustrator 和 Photoshop 推出一些新的工具和生成式 AI 功能。此次更新最引人注目的功能来自 Adobe 最新的 Firefly Vector AI 模型,该模型今天开始公开测试。
这个新的 Firefly Vector 模型为 Illustrator 带来了诸多新功能,比如生成形状填充 (Generative Shape Fill),用户可以通过描述性文本提示为形状添加详细的矢量图形。
更新后的模型还改进了文本到图案 (Text to Pattern) 的测试功能,可以用来创建可扩展的自定义矢量图案,如壁纸;
还有样式参考 (Style Reference),能够生成与现有样式相匹配的输出。
新的Mockup 工具允许您将矢量艺术品放置在几乎任何带有空白表面的模型图像上。这是一个 3 次点击的过程,您还可以随时进行非破坏性编辑。
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
生成形状填充(Beta):
• 由Firefly Vector Model提供支持。
• 使用文本提示快速填充详细、可编辑和可缩放的矢量。
• 确保与现有艺术作品的风格和颜色一致。
• 允许添加3D、几何、像素艺术等效果。
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
X 新上 一些新功能,鼠标放在某个头像上
会显示“更多账号相关信息”
点击可以呼出Grok 对该博主进行进一步问答了解
同时在X上面选中任何文字,也可随时向Grok 提问
它竟然知道我账号被冻结过,但是后续回答就很傻了。
🤣
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
MemO:为大语言模型提供永久记忆能力
实现跨应用程序的个性化AI体验
MemO为大语言模型提供了一层智能的、自我改进的记忆层,也就是为大语言模型(比如ChatGPT)提供了一个个性化记忆存储功能
使其能够记住和利用之前的交互信息,从而提供更加个性化的服务。
解决了Al模型缺乏长期记忆和个性化能力的问题,使AI能够根据用户历史和偏好提供更精确和有用的响应。
Memo适用于需要长期记忆和上下文保留的AI应用,如聊天机器人和智能助理。
例如:在客户支持系统中,Memo可以记住用户之前的问题和解决方案。当用户再次联系支持时,系统可以立即获取之前的互动记录,提供更快速和个性化的帮助。
详细介绍:t.co/Csso4YhSEs
![](/images/bg-white.png)
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
微软正式推出 Microsoft Designer
与 Microsoft 产品无缝集成 随时随地进行图像设计
该产品几乎集成到了微软产品的任何地方,随时可以唤起。
支持超过80种语言,提供免费的移动应用程序(iOS和Android)以及Windows应用程序。
利用AI能够智能检测图像中的对象, 可以对图像进行各种各样的编辑修改。
详细介绍:t.co/0vDSVi9XKM
![](/images/bg-white.png)
![](/images/bg-white.png)
![](/images/bg-white.png)
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
微软正式推出 Microsoft Designer
与 Microsoft 产品无缝集成 随时随地进行图像设计
该产品几乎集成到了微软产品的任何地方,随时可以唤起。
支持超过80种语言,提供免费的移动应用程序(iOS和Android)以及Windows应用程序。
利用AI 能够智能检测图像中的对象,可以对图像进行各种各样的编辑修改。
详细介绍:t.co/0vDSVi9XKM
![](/images/bg-white.png)
![](/images/bg-white.png)
![](/images/bg-white.png)
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
苹果开发出一种方法
解决了模型每次更新后出现的结果不一致问题
每次模型更新后,先前模型能够正确预测的实例在新模型中变得错误或者不一致。
这种现象被称为“负翻转”。
“负翻转”会导致用户体验下降,因为用户需要重新适应新模型的行为。
苹果公司开发的一种用于大语言模型(LLMs)更新的训练策略:MUSCLE
MUSCLE的核心是训练一个兼容性适配器,使得在更新模型基础部分后,任务特定的适配器可以减少负翻转现象并保持性能提升。
兼容性适配器从新版本模型的任务适配器初始化,然后进一步对其进行微调。微调过程中,兼容性适配器会对齐新旧模型的预测,确保新模型能够继承旧模型的正确预测行为。
采用知识蒸馏的方法,将旧模型的部分知识转移到新模型中。知识蒸馏通过最小化学生模型(新模型)和教师模型(旧模型)之间的KL散度来实现,这样新模型可以在保留自身性能提升的同时,尽可能模仿旧模型的预测行为。
详细内容:t.co/EazWK2aqJ2
![](/images/bg-white.png)
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
OpenAI 的 GPTs 已经很有没有进行功能更新和升级了
我猜测 OpenAI 已经有了更新的模式,或者根据泄露传言的信息,新版本的模型可能已经包含了GPTs的功能,甚至可以直接进行Agent…
因为从代码解释器、Dalle、语音功能和即将发布的视觉能力等路径来看,OpenAI都是最终把他们融合进了模型本身!
GPTs或许说会和插件功能一样的下场!
![](/images/bg-white.png)
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
Swapy:只需几行代码即可将任何网页布局
转换为可拖动交换的布局
• 拖动交换布局:允许用户通过拖动来交换布局中的任何元素。无论是图片、文字还是其他内容!
• 简便集成:提供了一个简单的集成方法,可以轻松添加到现有的网页或应用中。
• 灵活的配置:支持自定义配置,以满足不同的布局需求。
该工具的核心在于其简单易用的API,用户可以通过几行代码快速实现复杂的拖动交换功能。
GitHub:t.co/RWFMPxAHee
在线体验:t.co/M03IodDmoj
0
0
0
已过滤: . 继续显示
![avatar](https://file.aaaaa.bet/remote/assets/2024-07-24/a6b3WbXKJYHlvqNukQti.jpeg)
@imxiaohu@x.good.news
Karpathy 认为模型将会越来越小 而且更加智能
他认为目前的模型很大是因为,它们在训练过程中浪费了很多资源记住了互联网的内容。未来,通过改进训练数据,我们可以让模型变得更小,但更智能。
以下是主要观点:
1. 模型大小与思考能力:
• 目前的模型之所以如此庞大,是因为我们在训练过程中非常浪费资源,让它们记住了互联网的大量信息。这些模型甚至可以记住 SHA 哈希值等非常具体的细节。
• LLM 在记忆方面表现得比人类更好,能够在只需一次更新的情况下记住大量细节。
2. 训练方法的不足:
• 当前模型的预训练目标是背诵互联网的任意段落,这种训练方式导致模型需要记住大量的知识,而这些知识与“思考"能力交织在一起。
3. 未来的发展方向:
• 为了提高模型的思考能力,训练数据需要经过模型自动化的帮助进行重构和优化,形成理想的、合成的训练数据格式。
• 这种改进类似于一个阶梯式的过程,每个新模型帮助生成下一个模型的训练数据,直到达到“完美的训练集”。
4. 小模型的可能性:
• 未来即便是 GPT-2 规模的模型,如果在完美训练集上训练,也可能成为非常强大的模型。
• 虽然它们在某些细节上可能不如当前的大模型(例如化学知识记忆),但总体上会表现得更加智能。
原文翻译:
LLM模型大小的竞争正在加剧……反向发展!
我的赌注是,我们会看到一些非常非常小的模型,它们能够“思考”得非常好且可靠。很可能存在某种GPT-2参数设置,使得大多数人会认为GPT-2“聪明”。
当前模型如此庞大的原因是因为我们在训练过程中非常浪费资源——我们让它们记住整个互联网,而令人惊讶的是,它们确实做到了,例如可以背诵常见数字的SHA哈希值,或者记住非常晦涩的事实。(实际上,LLM在记忆方面非常出色,质上比人类好得多,有时只需一次更新就能长时间记住大量细节)。
但想象一下,如果你需要在闭卷测试中背诵互联网上任意段落的内容,只给出前几个词。这就是今天模型的标准(预)训练目标。做得更好的原因在于“思考”的展示与训练数据中的知识是“纠缠”在一起的。
因此,模型必须先变大然后再变小,因为我们需要它们(自动化地)帮助重构和塑造训练数据,使其成为理想的、合成的格式。
这是一个改进的阶梯——一个模型帮助生成下一个模型的训练数据,直到我们得到“完美的训练集”。当你用它来训练GPT-2时,它将成为一个非常强大/聪明的模型,以今天的标准来看。也许它的MMLU(多任务语言理解)得分会稍微低一些,因为它不会完美地记住所有化学知识。也许它偶尔需要查找一些东西以确保正确。
0
0
0
加载中
![](/_nuxt/loading.DTeACCS9.gif)