社区讨论:多数开发者认可,即便其他竞品被宣传为Claude Opus的替代品,处理大规模重构这类核心工作时仍更信任Claude。有用户指出,目前仍可通过API获取稳定的旧版Opus 4.5,问题出在新部署的模型上。有人观察到,Anthropic后台一直在做不透明的调整,持续调整路由导致模型性能不稳定,错误率升高已持续一整周,当前核心产品可用性仅达九个九。
不少用户调侃这是过载导致的问题,正好借机出去散步。
英伟达刚刚宣布了一种温水冷却系统,称其可以大幅减少数据中心的用水量——根据英伟达一位高管在新闻稿中的说法,该技术可以消除数据中心内部“几乎所有的用水”。
“数据中心的用水挑战基本解决了,”英伟达首席可持续发展官 Josh Parker 最近告诉 Axios。
但这只是用水故事的一部分。只要 AI 数据中心仍然依赖化石燃料运行——这一选择科技公司正越来越普遍地做出——那么节水努力就止步于数据中心的外墙。
𝕏 实时信号 + arXiv 前沿论文,经 AI 聚类解读 · 一眼扫完全貌
依赖Claude付费模型接连出问题,正在用它干活的人要注意输出结果了
社区讨论:多数开发者认可,即便其他竞品被宣传为Claude Opus的替代品,处理大规模重构这类核心工作时仍更信任Claude。有用户指出,目前仍可通过API获取稳定的旧版Opus 4.5,问题出在新部署的模型上。有人观察到,Anthropic后台一直在做不透明的调整,持续调整路由导致模型性能不稳定,错误率升高已持续一整周,当前核心产品可用性仅达九个九。
不少用户调侃这是过载导致的问题,正好借机出去散步。
有人用大语言模型自己做了学外语的工具,效果比付费私教还好,省了私教课的钱。
有人发布了适配 Claude Code 的开源工具,给它增加本地存储的项目记忆功能。
社区讨论:多数开发者表示不需要这款本地项目记忆工具,有人习惯分多个短会话使用Claude,启动新任务直接开新会话,不需要预先给Claude讲解整个项目;有人认为Claude本身能弄清楚项目情况,优化这个场景没有价值。不少人提到可以用CLAUDE.md、memory.md或者自带的 ticketing 系统存储项目上下文,也有人质疑这款工具没有基准测试证明效果,疑问为何不用前沿大模型做项目总结。
想要低成本运行特定AI功能,不需要调用大参数云端模型,本地小模型微调就能得到不错效果
社区讨论:多数从业者认为,对于简单分类任务,用Scikit Learn的SGD分类器处理二元语法即可,模型体积小于1MB、训练不到一分钟,比微调小大模型更轻量;也有用户提到,现有嵌入模型通过计算分类嵌入余弦相似度就能完成分类,还可以直接在BERT上加分类头。有用户提出,小大模型分类存在不遵守指定分类列表、自创类别的问题,询问能否通过输出语法约束解决,另有用户认为微调后的小参数大模型有明确适用场景,推荐Qwen 0.6B、gemma3:270m等模型。
有人翻出了Claude Code「深度思考」模块的输出内容,目前已有上千人参与讨论
社区讨论:多数参与者确认,不止Anthropic,OpenAI等几乎所有头部AI公司都隐藏了模型的实际推理过程,核心原因是推理机制属于核心研发成果,公开后会被竞争对手轻易获取。有人表示不会使用隐藏推理的美国模型,认为这既增加prompt优化难度,还会让攻击者注入隐藏目标更难被发现。也有人质疑,目前没人真的理解大语言模型如何思考,隐藏的推理过程不一定符合人类认知里的推理逻辑,公开后反而可能引发用户不必要的恐慌。
使用Codex的开发者需要检查本地磁盘占用,避免资料被无预警挤占。
社区讨论:多数用户吐槽Codex产品质量粗糙,称仅在Mac上显示加载 spinner就会占满100%GPU,风扇狂转,这类已知严重bug近半年都没修复,这次占满固态硬盘的漏洞公开一周OpenAI仍无回应。有人反驳称这类无限写入bug也曾出现在老牌非AI开源项目中,不该只归因为产品粗糙。还有用户分享了临时修复方案,对比后指出Codex延迟体验远不如Claude。
已经有1.2亿OKX用户,未来可以在同一基础设施交易代币化股票和加密衍生品,获得合规的资产保护。
OKX 刚刚和 ICE 成立了持股各 50% 的合资企业,ICE 是拥有纽交所(NYSE)、每年清算名义衍生品交易量超过 10 万亿美元的公司。合资企业目标是获得美国经纪交易商和 FCM 注册。
OKX 的 1.2 亿用户将获得通证化股票,依托每年在 13 家全球清算所结算 30 亿份合约的同一基础设施,实现真实清算、规范保证金管理和期货交易。
hyperliquid 股票永久合约已经证明了市场需求:在无 KYC 的情况下持仓量(OI)达到 16.7 亿美元。现在受监管版本即将推出,有真正的托管方,还有接近 SIPC 的保护。
Base 将在 6 月 25 日推出 B20 标准,采用原生合规的通证设计,适配通证化证券。
Coinbase 已经拿到了经纪交易商、ATS 和 FCM 牌照。
很快主权国家就会开始买入你的比特币,但真正能释放资本效率的,是用通证化股票对加密衍生品头寸进行交叉保证金抵押。以上就是我的观点。
依赖开源工具的开发者和普通用户,终于有联合力量补齐关键开源项目的安全漏洞了
未来AI工具要由亲手用它们的创作者来定义方向,这是大AI公司和内容创作者合作的首个公开项目
iOS和macOS开发者借助Codex探索新框架,能更快推进之前没法做出来的想法
对于 iOS 和 macOS 开发者 @PaulSolt 来说,当他探索新框架、推进以前无法实现的想法时,Codex 就像一个研究搭档一样帮他更快推进工作。
对写代码的认知发生错位的人,可以重新理解编程的本质,AI只是这套思维方法里的一部分
AI与过往学术研究的结合将产生值得探讨的新变化
AI和过往学术研究之间的互动会变得非常奇特。这次我把我研究生阶段发表的第一篇论文发给了GPT-5.5 Pro,让它找出错误并更新内容。
它找到了新数据,完成了分析,生成了可复现的文件,拓展了核心论点……
这些成果都很棒,其中部分内容比我多年前写的论文要复杂成熟得多。如果我们把这类AI大规模应用到过往学术研究上,会发生什么?我们现在就应该这么做吗?
顺便说一下,原论文提出的问题是:
自论文发表以来,有哪些文献的发展与其主题或发现形成了对话或张力?(这点就算是深耕领域的学者,也很难靠自己完成)
AI变化太快,变量太多。适合你自己需求的工具,往往找不到现成的,可以考虑自己动手搭一个
不少人说AI能耗太高推高电价。有人出来澄清,目前AI消耗的电力,占全球总电力需求不到1%
A24出过《瞬息全宇宙》这类获奖影片,这次和谷歌合作,一起开发专门给电影创作用的AI工具
之前主流AI视频大多只能生成15到20秒,拼长视频容易出现人物变形,这个新模型预计7月初上线
发言人称,欧洲本土的Mistral模型效果,已经不如中国的通义千问9B(Qwen 9B)了
重复工作流的搭建原本需要手动处理,现在开发者可以直接在编辑器里用AI更快完成搭建和管理
Cursor 在其 AI 编码环境中发布了一个全新的 /automate 技能,可直接在环境内创建自动化流程。
该功能旨在减少设置重复性工作流所需的手工操作,让开发者可以借助 AI 更快地构建和管理自动化。
见过不同规模公司踩坑的人总结,全流程丢给AI自主写代码上线,是摧毁代码仓库最快的方法。要不要让人介入检查,现在要想清楚了。
毁掉你的代码库最快的方法是什么?
Dexter Horthy(HumanLayer 首席执行官)见过各种规模的公司让智能体从需求规格直接走到生产上线,最后把一切都搞砸。
什么时候该让 AI 掌舵,什么时候又需要人在流程中参与把控?
要承载每日数百万分钟的音频服务,把模型延迟控制在90毫秒内,需要合适的GPU集群支持才能落地生产
.@cartesia 运营着要求最高的推理负载之一:实时语音。
他们的技术栈必须维持长生命周期流稳定运行,每日服务数百万分钟的音频,并且将模型延迟控制在90ms左右。
Together 为他们提供了托管式GPU基础设施,以及底层集群控制能力,支撑这项业务在生产环境运行。
有人打包了开源模型做插件替换付费AI工具,目前体验下来,代码审查效果不错,但做前端开发效果不好。
我一直在试用 @SakanaAILabs 的 Fugu Ultra,把它作为 Fable 的替代模型来用。我把它打包成了 codex/claude 的插件。
我没有做严格的评估😅,但体验下来感觉它的能力有点参差不齐。
举例来说:它做代码审查看起来很不错,但不适合前端开发。很好奇其他人目前用下来有什么发现。
GLM-5.2是用来探索token成本优化的新前沿模型
Seedance-2.0占视频生成AI榜首近四月,这次同步推出Opus级通用大语言模型,和当前最优水平的图像模型
Bytedance 凭借 Seedance-2.0 占据视频生成 AI 的头把交椅已近四个月,甚至没有其他产品能接近它的水平。
今天,他们发布了性能更强的 2.5 版本模型。
同时他们还一并推出了一个 Opus 级别的通用大语言模型,以及一个 SoTA 级别的图像模型。
中国 AI 的发展速度快得离谱。
牛津大学顶级数学教授公开呼吁直接关停AI研发,认为对手会借此获利,这是行业内最新的强硬表态。
两分钟就能配置完成,包含344个模型、兼容OpenAI接口,每月免费提供1000万token。
目前最强的代码模型之一 DeepSeek V4 Pro 可以通过 Runtime 免费使用,仅需 2 分钟配置完成。
总共 344 个模型,统一提供一个兼容 OpenAI 的端点,无需绑定信用卡,每月免费赠送 1000 万 tokens。
针对如何最大化LLM订阅价值的问题给出实用阶梯方案
分享探讨编码智能体如何影响软件工程与工程师需求的思路
无需API配置,在Together Chat即可免费测试GLM-5.2
所有人都在找可以测试 GLM-5.2 的地方。你可以在 Together Chat 免费试用它(链接附在下方)。不需要配置 API,只要选中 GLM-5.2 就可以开始写提示词了。服务由 Together AI 部署在安全的北美基础设施上运行。
前往 Together Chat 免费试用 GLM-5.2
跟着四步操作就能添加自定义AI翻译服务,不用再给官方翻译付费,普通上网看外文的成本就能降下来
兄弟们,睡前搞个小教程给大家!
直接教你将免费或者低成本的模型接入到沉浸式翻译,不废话直接看视频操作,包你学会。
操作步骤如下:
1. 打开沉浸式翻译,点击“设置”
2. 进入设置后,点击左侧的“翻译服务”
3. 点击右上角的“添加自定义翻译服务”,然后选择“自定义 AI”
4. 在自定义 AI 页面填入 API Key,以及你接入的大模型 API 接口地址
(a) 接口地址务必填对,不同的模型可能会有一些差别,可以查看对应的官方文档
(b) 选择对应的模型。如果你使用的是自定义模型,请勾选下方框中的“输入自定义模型名称”
(c) 我这里以小米的 MiMo 模型为例,给大家进行视频演示 (Base URL :
5. 填好后点击“测试服务”,如果测试通过,就完成了对应的配置
如果你想要切换使用,直接在沉浸式翻译的服务选项中,选择你刚刚自定义的模型即可,非常方便。
你学会了吗?
记得一键三连啊,兄弟们!
有人用 Claude Code 把特定图像模型转成了ONNX格式(一种通用模型格式),不用连服务器就能本地运行
大量低质量AI音乐涌入平台,会挤压独立创作音乐的推荐流量,原本能被听到的作品更难获得曝光
在Grok Build里调用/goals就能让AI自主完成耗时久的工作,不用一直盯着手动发指令
这套系统给人机协作的工业机器人做安全防护,用IGX Thor和Holoscan提供算力支持
机器人与人类协同工作,安全必须放在第一位。
NVIDIA Halos for Robotics 是业内首个面向物理 AI 的全栈安全系统,由 IGX Thor 和 Holoscan 提供支持。
@agilityrobotics 成为首家将该系统集成到工厂和仓库人形机器人中的企业。
点击阅读完整公告 📰 #Automate2026
谷歌DeepMind押注AI在影视行业的应用,具体的落地方向还没有更多细节公布
GLM-5.2是纯文本模型,却在GDPval-AA评测排第三,而真实知识工作往往需要看图表,这项评测没法反映真实需求
GLM-5.2 看起来是个不错的模型,但它作为纯文本模型仍能在 GDPval-AA 上拿到第三名,这一事实表明 GDPval-AA 无法反映大量知识工作的真实情况。
这些知识工作需要阅读图表、调整设计,以及完成其他可视化相关任务。
AI助力科学发展,不止取决于模型能力,还要看研究者、评审和资助方是否更看重原创而非速度
能帮调用大模型的团队控制花费,还能自动隐藏敏感个人信息,不用出事之后再补救。
LangSmith LLM Gateway 部署在你的智能代理与 LLM 提供商之间。
它会强制实施支出限额,并在请求抵达模型前脱敏掉 PII,从源头阻止问题,而非仅仅在损失发生后记录日志。
你所需了解的全部信息:
这项设计靠提高运行温度减少水资源消耗
想在自己电脑上跑大模型,可以去读这篇汇总了所有要点的指南,用的工具是llamacpp。
想求职AI相关岗位,可以直接参考这份经过47场面试检验的备考笔记
这位博士生拿到 OpenAI offer 前,一共参加了 47 场面试,收获了 4 份录用通知。
她整理的数学、机器学习和大语言模型面试准备笔记现在已经公开,完全免费,逻辑清晰好上手。
值得收藏。
智能体现在可以在运行环境内部调用工具,不把中间结果存入模型上下文,只传回相关输出,减少往返次数,降低token消耗
Deep Agents v0.6 功能亮点:代码解释器。
智能体现在可以在运行时内部调用工具,将中间结果保留在模型上下文之外,只传回相关输出。
更少往返次数。更少 token 浪费。
需要前沿AI能力又受出口管制限制,现在多智能体编排系统可以选这款不受地缘政治约束的产品。
一个日本小团队构建了一款能够与 Fable 级别模型竞争的 AI 模型。 Sakana AI 刚刚发布了 Fugu。
这是一个完整的多智能体编排系统,可通过单一模型 API 访问。
Fugu Ultra 的性能可与 Fable 和 Mythos 匹敌,而且它在构建时明确排除了出口管制风险。
前沿能力。不附带地缘政治条件。
安全团队可以用它完成深度扫描、漏洞验证、生成针对性修复补丁,还能导出结果到其他工具
做出来的AI应用可以直接发布分享,教程讲清了发布的具体操作步骤
创作者分享对AI生成内容的感受,称其易丢失个人特质
最近看 AI 内容有个很强的感觉: 最假的是它太顺了。 每句话都对,每个词都稳,逻辑也完整,但读完就是不知道这个人到底经历过什么。 AI 能把表达磨得很亮,但也很容易把人味一起磨掉。 以后有辨识度的内容,可能不是更完美,而是更具体、更敢暴露一点偏见和笨拙。 你们刷到 AI 味很重的内容,一般是哪一瞬间看出来的?
补一句:我不是讨厌 AI 写作,我自己也用。 但我现在越来越在意一件事: AI 很擅长给你“正确的话”,不太擅长给你“只有你会说的话”。 内容真正有记忆点,往往不是因为它标准,而是里面有一个人的取舍、犹豫、小偏见。 这部分,暂时还得自己交出来。
美光成为Anthropic的投资者、客户、合作伙伴与供应商
🚨美光宣布与Anthropic达成战略协议
- 多年期HBM、DRAM和SSD供货协议
- 围绕Claude的工作负载共同设计内存与存储
- Claude将在美光内部全面部署
- 美光参投了Anthropic的H轮融资
美光现在同时是Anthropic的投资方、客户、合作伙伴与供应商。
来源:
两分钟就能配置完成,包含344个模型、兼容OpenAI接口,每月免费提供1000万token。
目前最强的代码模型之一 DeepSeek V4 Pro 可以通过 Runtime 免费使用,仅需 2 分钟配置完成。
总共 344 个模型,统一提供一个兼容 OpenAI 的端点,无需绑定信用卡,每月免费赠送 1000 万 tokens。
Seedance-2.0占视频生成AI榜首近四月,这次同步推出Opus级通用大语言模型,和当前最优水平的图像模型
Bytedance 凭借 Seedance-2.0 占据视频生成 AI 的头把交椅已近四个月,甚至没有其他产品能接近它的水平。
今天,他们发布了性能更强的 2.5 版本模型。
同时他们还一并推出了一个 Opus 级别的通用大语言模型,以及一个 SoTA 级别的图像模型。
中国 AI 的发展速度快得离谱。
重复工作流的搭建原本需要手动处理,现在开发者可以直接在编辑器里用AI更快完成搭建和管理
Cursor 在其 AI 编码环境中发布了一个全新的 /automate 技能,可直接在环境内创建自动化流程。
该功能旨在减少设置重复性工作流所需的手工操作,让开发者可以借助 AI 更快地构建和管理自动化。
需要前沿AI能力又受出口管制限制,现在多智能体编排系统可以选这款不受地缘政治约束的产品。
一个日本小团队构建了一款能够与 Fable 级别模型竞争的 AI 模型。 Sakana AI 刚刚发布了 Fugu。
这是一个完整的多智能体编排系统,可通过单一模型 API 访问。
Fugu Ultra 的性能可与 Fable 和 Mythos 匹敌,而且它在构建时明确排除了出口管制风险。
前沿能力。不附带地缘政治条件。
智能体现在可以在运行环境内部调用工具,不把中间结果存入模型上下文,只传回相关输出,减少往返次数,降低token消耗
Deep Agents v0.6 功能亮点:代码解释器。
智能体现在可以在运行时内部调用工具,将中间结果保留在模型上下文之外,只传回相关输出。
更少往返次数。更少 token 浪费。
已经有1.2亿OKX用户,未来可以在同一基础设施交易代币化股票和加密衍生品,获得合规的资产保护。
OKX 刚刚和 ICE 成立了持股各 50% 的合资企业,ICE 是拥有纽交所(NYSE)、每年清算名义衍生品交易量超过 10 万亿美元的公司。合资企业目标是获得美国经纪交易商和 FCM 注册。
OKX 的 1.2 亿用户将获得通证化股票,依托每年在 13 家全球清算所结算 30 亿份合约的同一基础设施,实现真实清算、规范保证金管理和期货交易。
hyperliquid 股票永久合约已经证明了市场需求:在无 KYC 的情况下持仓量(OI)达到 16.7 亿美元。现在受监管版本即将推出,有真正的托管方,还有接近 SIPC 的保护。
Base 将在 6 月 25 日推出 B20 标准,采用原生合规的通证设计,适配通证化证券。
Coinbase 已经拿到了经纪交易商、ATS 和 FCM 牌照。
很快主权国家就会开始买入你的比特币,但真正能释放资本效率的,是用通证化股票对加密衍生品头寸进行交叉保证金抵押。以上就是我的观点。
AI变化太快,变量太多。适合你自己需求的工具,往往找不到现成的,可以考虑自己动手搭一个
不少人说AI能耗太高推高电价。有人出来澄清,目前AI消耗的电力,占全球总电力需求不到1%
A24出过《瞬息全宇宙》这类获奖影片,这次和谷歌合作,一起开发专门给电影创作用的AI工具
之前主流AI视频大多只能生成15到20秒,拼长视频容易出现人物变形,这个新模型预计7月初上线
发言人称,欧洲本土的Mistral模型效果,已经不如中国的通义千问9B(Qwen 9B)了
使用Codex的开发者需要检查本地磁盘占用,避免资料被无预警挤占。
社区讨论:多数用户吐槽Codex产品质量粗糙,称仅在Mac上显示加载 spinner就会占满100%GPU,风扇狂转,这类已知严重bug近半年都没修复,这次占满固态硬盘的漏洞公开一周OpenAI仍无回应。有人反驳称这类无限写入bug也曾出现在老牌非AI开源项目中,不该只归因为产品粗糙。还有用户分享了临时修复方案,对比后指出Codex延迟体验远不如Claude。
有人翻出了Claude Code「深度思考」模块的输出内容,目前已有上千人参与讨论
社区讨论:多数参与者确认,不止Anthropic,OpenAI等几乎所有头部AI公司都隐藏了模型的实际推理过程,核心原因是推理机制属于核心研发成果,公开后会被竞争对手轻易获取。有人表示不会使用隐藏推理的美国模型,认为这既增加prompt优化难度,还会让攻击者注入隐藏目标更难被发现。也有人质疑,目前没人真的理解大语言模型如何思考,隐藏的推理过程不一定符合人类认知里的推理逻辑,公开后反而可能引发用户不必要的恐慌。
想要低成本运行特定AI功能,不需要调用大参数云端模型,本地小模型微调就能得到不错效果
社区讨论:多数从业者认为,对于简单分类任务,用Scikit Learn的SGD分类器处理二元语法即可,模型体积小于1MB、训练不到一分钟,比微调小大模型更轻量;也有用户提到,现有嵌入模型通过计算分类嵌入余弦相似度就能完成分类,还可以直接在BERT上加分类头。有用户提出,小大模型分类存在不遵守指定分类列表、自创类别的问题,询问能否通过输出语法约束解决,另有用户认为微调后的小参数大模型有明确适用场景,推荐Qwen 0.6B、gemma3:270m等模型。
有人发布了适配 Claude Code 的开源工具,给它增加本地存储的项目记忆功能。
社区讨论:多数开发者表示不需要这款本地项目记忆工具,有人习惯分多个短会话使用Claude,启动新任务直接开新会话,不需要预先给Claude讲解整个项目;有人认为Claude本身能弄清楚项目情况,优化这个场景没有价值。不少人提到可以用CLAUDE.md、memory.md或者自带的 ticketing 系统存储项目上下文,也有人质疑这款工具没有基准测试证明效果,疑问为何不用前沿大模型做项目总结。
有人用大语言模型自己做了学外语的工具,效果比付费私教还好,省了私教课的钱。
依赖Claude付费模型接连出问题,正在用它干活的人要注意输出结果了
社区讨论:多数开发者认可,即便其他竞品被宣传为Claude Opus的替代品,处理大规模重构这类核心工作时仍更信任Claude。有用户指出,目前仍可通过API获取稳定的旧版Opus 4.5,问题出在新部署的模型上。有人观察到,Anthropic后台一直在做不透明的调整,持续调整路由导致模型性能不稳定,错误率升高已持续一整周,当前核心产品可用性仅达九个九。
不少用户调侃这是过载导致的问题,正好借机出去散步。
未来AI工具要由亲手用它们的创作者来定义方向,这是大AI公司和内容创作者合作的首个公开项目
这项设计靠提高运行温度减少水资源消耗
跟着四步操作就能添加自定义AI翻译服务,不用再给官方翻译付费,普通上网看外文的成本就能降下来
兄弟们,睡前搞个小教程给大家!
直接教你将免费或者低成本的模型接入到沉浸式翻译,不废话直接看视频操作,包你学会。
操作步骤如下:
1. 打开沉浸式翻译,点击“设置”
2. 进入设置后,点击左侧的“翻译服务”
3. 点击右上角的“添加自定义翻译服务”,然后选择“自定义 AI”
4. 在自定义 AI 页面填入 API Key,以及你接入的大模型 API 接口地址
(a) 接口地址务必填对,不同的模型可能会有一些差别,可以查看对应的官方文档
(b) 选择对应的模型。如果你使用的是自定义模型,请勾选下方框中的“输入自定义模型名称”
(c) 我这里以小米的 MiMo 模型为例,给大家进行视频演示 (Base URL :
5. 填好后点击“测试服务”,如果测试通过,就完成了对应的配置
如果你想要切换使用,直接在沉浸式翻译的服务选项中,选择你刚刚自定义的模型即可,非常方便。
你学会了吗?
记得一键三连啊,兄弟们!
有人用 Claude Code 把特定图像模型转成了ONNX格式(一种通用模型格式),不用连服务器就能本地运行
大量低质量AI音乐涌入平台,会挤压独立创作音乐的推荐流量,原本能被听到的作品更难获得曝光
在Grok Build里调用/goals就能让AI自主完成耗时久的工作,不用一直盯着手动发指令
这套系统给人机协作的工业机器人做安全防护,用IGX Thor和Holoscan提供算力支持
机器人与人类协同工作,安全必须放在第一位。
NVIDIA Halos for Robotics 是业内首个面向物理 AI 的全栈安全系统,由 IGX Thor 和 Holoscan 提供支持。
@agilityrobotics 成为首家将该系统集成到工厂和仓库人形机器人中的企业。
点击阅读完整公告 📰 #Automate2026
谷歌DeepMind押注AI在影视行业的应用,具体的落地方向还没有更多细节公布
GLM-5.2是纯文本模型,却在GDPval-AA评测排第三,而真实知识工作往往需要看图表,这项评测没法反映真实需求
GLM-5.2 看起来是个不错的模型,但它作为纯文本模型仍能在 GDPval-AA 上拿到第三名,这一事实表明 GDPval-AA 无法反映大量知识工作的真实情况。
这些知识工作需要阅读图表、调整设计,以及完成其他可视化相关任务。
牛津大学顶级数学教授公开呼吁直接关停AI研发,认为对手会借此获利,这是行业内最新的强硬表态。
GLM-5.2是用来探索token成本优化的新前沿模型
见过不同规模公司踩坑的人总结,全流程丢给AI自主写代码上线,是摧毁代码仓库最快的方法。要不要让人介入检查,现在要想清楚了。
毁掉你的代码库最快的方法是什么?
Dexter Horthy(HumanLayer 首席执行官)见过各种规模的公司让智能体从需求规格直接走到生产上线,最后把一切都搞砸。
什么时候该让 AI 掌舵,什么时候又需要人在流程中参与把控?
对写代码的认知发生错位的人,可以重新理解编程的本质,AI只是这套思维方法里的一部分
AI助力科学发展,不止取决于模型能力,还要看研究者、评审和资助方是否更看重原创而非速度
要承载每日数百万分钟的音频服务,把模型延迟控制在90毫秒内,需要合适的GPU集群支持才能落地生产
.@cartesia 运营着要求最高的推理负载之一:实时语音。
他们的技术栈必须维持长生命周期流稳定运行,每日服务数百万分钟的音频,并且将模型延迟控制在90ms左右。
Together 为他们提供了托管式GPU基础设施,以及底层集群控制能力,支撑这项业务在生产环境运行。
安全团队可以用它完成深度扫描、漏洞验证、生成针对性修复补丁,还能导出结果到其他工具
能帮调用大模型的团队控制花费,还能自动隐藏敏感个人信息,不用出事之后再补救。
LangSmith LLM Gateway 部署在你的智能代理与 LLM 提供商之间。
它会强制实施支出限额,并在请求抵达模型前脱敏掉 PII,从源头阻止问题,而非仅仅在损失发生后记录日志。
你所需了解的全部信息:
有人打包了开源模型做插件替换付费AI工具,目前体验下来,代码审查效果不错,但做前端开发效果不好。
我一直在试用 @SakanaAILabs 的 Fugu Ultra,把它作为 Fable 的替代模型来用。我把它打包成了 codex/claude 的插件。
我没有做严格的评估😅,但体验下来感觉它的能力有点参差不齐。
举例来说:它做代码审查看起来很不错,但不适合前端开发。很好奇其他人目前用下来有什么发现。
iOS和macOS开发者借助Codex探索新框架,能更快推进之前没法做出来的想法
对于 iOS 和 macOS 开发者 @PaulSolt 来说,当他探索新框架、推进以前无法实现的想法时,Codex 就像一个研究搭档一样帮他更快推进工作。
想求职AI相关岗位,可以直接参考这份经过47场面试检验的备考笔记
这位博士生拿到 OpenAI offer 前,一共参加了 47 场面试,收获了 4 份录用通知。
她整理的数学、机器学习和大语言模型面试准备笔记现在已经公开,完全免费,逻辑清晰好上手。
值得收藏。
做出来的AI应用可以直接发布分享,教程讲清了发布的具体操作步骤
想在自己电脑上跑大模型,可以去读这篇汇总了所有要点的指南,用的工具是llamacpp。
依赖开源工具的开发者和普通用户,终于有联合力量补齐关键开源项目的安全漏洞了
AI与过往学术研究的结合将产生值得探讨的新变化
AI和过往学术研究之间的互动会变得非常奇特。这次我把我研究生阶段发表的第一篇论文发给了GPT-5.5 Pro,让它找出错误并更新内容。
它找到了新数据,完成了分析,生成了可复现的文件,拓展了核心论点……
这些成果都很棒,其中部分内容比我多年前写的论文要复杂成熟得多。如果我们把这类AI大规模应用到过往学术研究上,会发生什么?我们现在就应该这么做吗?
顺便说一下,原论文提出的问题是:
自论文发表以来,有哪些文献的发展与其主题或发现形成了对话或张力?(这点就算是深耕领域的学者,也很难靠自己完成)
美光成为Anthropic的投资者、客户、合作伙伴与供应商
🚨美光宣布与Anthropic达成战略协议
- 多年期HBM、DRAM和SSD供货协议
- 围绕Claude的工作负载共同设计内存与存储
- Claude将在美光内部全面部署
- 美光参投了Anthropic的H轮融资
美光现在同时是Anthropic的投资方、客户、合作伙伴与供应商。
来源:
创作者分享对AI生成内容的感受,称其易丢失个人特质
最近看 AI 内容有个很强的感觉: 最假的是它太顺了。 每句话都对,每个词都稳,逻辑也完整,但读完就是不知道这个人到底经历过什么。 AI 能把表达磨得很亮,但也很容易把人味一起磨掉。 以后有辨识度的内容,可能不是更完美,而是更具体、更敢暴露一点偏见和笨拙。 你们刷到 AI 味很重的内容,一般是哪一瞬间看出来的?
补一句:我不是讨厌 AI 写作,我自己也用。 但我现在越来越在意一件事: AI 很擅长给你“正确的话”,不太擅长给你“只有你会说的话”。 内容真正有记忆点,往往不是因为它标准,而是里面有一个人的取舍、犹豫、小偏见。 这部分,暂时还得自己交出来。
无需API配置,在Together Chat即可免费测试GLM-5.2
所有人都在找可以测试 GLM-5.2 的地方。你可以在 Together Chat 免费试用它(链接附在下方)。不需要配置 API,只要选中 GLM-5.2 就可以开始写提示词了。服务由 Together AI 部署在安全的北美基础设施上运行。
前往 Together Chat 免费试用 GLM-5.2
分享探讨编码智能体如何影响软件工程与工程师需求的思路
针对如何最大化LLM订阅价值的问题给出实用阶梯方案
精选文章的中文编辑重写 · 按更新时间排列
每天三次更新,不错过重要信号
添加到 Feedly、Inoreader 等阅读器,自动接收更新
https://ai-pulse-lab.com/feed.xml
把以下内容发给你的 AI Agent(Claude/ChatGPT/Manus 等),它会帮你设定每日推送:
请帮我设置一个定时任务,每天北京时间 9:30、15:00 和 19:30 各执行一次: 请求 https://ai-pulse-lab.com/api/brief.json,读取返回 JSON 中的 textPlain 字段,将内容发送给我。 补充:每日北京时间 09:00、14:30 和 19:30 更新,建议更新后 30 分钟查询。可先请求 /api/manifest.json 检查 nextUpdateAt 字段。无需认证,直接 GET 请求即可。