AI科技大本营-优快云博客

转载 OpenAI 工程师最新演讲：代码只占程序员核心价值的 10%，未来属于“结构化沟通”

他提出，代码只是我们意图的一种“有损投影”，而真正有价值、能够跨越人与机器鸿沟的，是规约（Specification）。然而，当我们用 prompt 和大语言模型（LLM）互动时，我们却在做相反的事情：我们保留了生成的代码，却删掉了 prompt。然后，我们将原始规约、输入 prompt 和模型的回复，一起交给另一个“评分模型”（grader model），让它根据规约来给模型的回复打分。同理，代码本身，即便是写得很好的代码，通常也无法完全承载所有的意图和价值观。你看的是你的代码对世界产生的影响。

2025-07-15 16:33:05 9

转载对话 Ruby on Rails 之父：发自内心恨透 Copilot，手凿代码才是程序员的乐趣

这说明我所做的事情，我所说的话，触动了人们的神经。苹果告诉我们，我们的 app 违反了他们的规定，因为我们没有在 app 内提供通过苹果支付系统进行订阅的选项。我觉得，“好吧，这东西不适合我。PHP 是我最终豁然开朗的地方，当我终于理解了条件、循环、变量以及所有这些东西，足以让我认为，我能行。这是一个巨大的胜利，不仅是对我们，也是对所有在 App Store 里受到不公平待遇的开发者。当我遇到一个我不熟悉的领域时，比如一个新的库，或者一门新的语言。这种程度的信任，在当时，甚至现在，都是闻所未闻的。

2025-07-14 14:37:03 45

转载「0天复刻Manus」的背后，这名95后技术人坚信：“通用Agent一定存在，Agent也有Scaling Law”| 万有引力

gent 背后对接不同、特定的模型，每个 Agent 还会接入专属的工具和知识库，以此形成一个更加分工明确、组合灵活、成本可控的 Agent 生态。实际上，在这之前我们还有一个名为 CRAB 的项目，它是一个跨端项目，可在本地 PC 和手机上执行操作，这也是全球首个此类项目。引发了广泛的争议与探讨。一方面，部分研究者坚信，随着模型技术的进步，Agent 将能实现从特定任务向通用能力的跨越；大家好，我是范文栋，CAMEL-AI 的核心贡献者，也是 Eigent AI 的技术负责人（Tech Lead）。

2025-07-11 17:11:17 117

原创马斯克发布“地球最强AI模型”Grok 4：横扫所有榜单，在“人类最终测试”超越人类博士”！

在长达 4 分半钟的深度“思考”后，Grok 4 浏览了大量赔率网站，分析了各队实力，甚至计算了自己的“Alpha 优势”，最终给出了洛杉矶道奇队以 21.6% 的概率获胜的结论，并详细阐述了整个推理过程。的互动中，它能根据指令，用低语来安抚紧张的主持人，也能即兴高歌一曲关于“健怡可乐”的咏叹调，甚至在被要求“直接唱”时，无缝切换到另一种歌唱风格。新的声音模型，如充满磁性的“Sal”（发布会开场“电影预告片”的配音）和温柔知性的“Eve”，在自然度、韵律和情感表达上都达到了新的高度。这值得我们反复回味。

2025-07-10 15:15:58 1012

转载为什么 AI 搞不定体力活——对话清华大学刘嘉：这才是生物智能最难攻克的“万里长征” | 万有引力

作者 | 唐小引出品 | 优快云（ID：优快云news）1997 年，AI 正处于第二次寒冬，这次寒潮的时间有点长，从 20 世纪 90 年代直至 21 世纪的第一个十年。寒冬之下，有人坚持，有人幸运，也有人不是那么地有运气。李飞飞说：“我觉得自己是世界上最幸运的人，因为我的整个职业生涯始于 AI 寒冬的末期，也就是 AI 开始腾飞的时候，所以我真的非常幸运，也有点自豪。”而在现任清华大学基础科学讲席教授、心理与认知科学系主任、人工智能学院教授、北京智源人工智能研究院首席科学家刘嘉的世界里，则不一样。1

2025-07-09 16:02:02 146

转载 AI 会先毁掉年轻人，还是职场老将？

长期以来，我们对职业生涯的想象是一条线性的“登天梯”：从一个不起眼的初级岗位开始，通过完成基础的“脚手架工作”（Scaffolding Jobs），一步步学习、成长，最终向上攀登。他们面临的不是竞争的失败，而是竞争资格的丧失。贾西将生成式 AI 定义为“一生一次的技术变革”，并明确表示，亚马逊将利用 AI 带来的效率提升，“在未来几年内，减少我们的企业员工总数”，并打造。如果说年轻人的困境是“无门可入”，那么经验丰富的老将们面临的则是另一重危机：他们用数十年职业生涯建立起来的“经验壁垒”正在迅速瓦解。

2025-07-08 18:33:12 192

转载繁荣之下，全是代价：硅谷顶级VC深入300家公司战壕，揭秘成本、路线、人才、产品四大天坑

他们的“Playbook”（战术手册）上，写下的究竟是通往圣杯的地图，还是九死一生的航海日志？这意味着，AI 的价值正在从“生成内容”的辅助工具，进化为“完成任务”的自主伙伴。更可怕的是，仍有 11% 的 AI 赋能公司在“预发布（Pre-Launch）”阶段挣扎，而 AI 原生公司几乎全部（99%）都已将产品推向市场。它证明了，在当前阶段，AI 对结构化、逻辑性强的任务（如编程）的赋能效果，远超那些需要创造力、同理心和复杂商业判断的任务。“我们使用不同的专有和第三方模型，因为客户的需求是多样化的。

2025-07-07 16:55:38 219

原创不死的程序员

但他可能并不知道，这个小小的图表控件背后，是另一家软件公司的 C++ 程序员们，耗费了数月甚至数年的时间，去解决图形渲染的效率问题、处理复杂的坐标系转换、优化内存占用，最终才将这一切封装成一个简单易用的“黑盒子”。现实情况是，那位办公室文员确实可以快速生成报表，但他所查询的那个庞大、稳定、安全的核心数据库系统，依然是由一队专业的数据库管理员和程序员，使用C或PL/SQL等“过程式”语言，精心设计、构建和维护的。这些所谓的“软技能”，在这个全球化协作的时代，被证明是不可或缺的、处于核心地位的硬实力。

2025-07-04 17:01:27 709

转载 OpenAI快被小扎“挖空”？！Meta斥上亿美元“偷家”，挖来了一个「最强AI团队」

他曾在微软掌舵 GitHub，近年则活跃于 AI 投资界，并参与了包括 Midjourney、Mistral、Character.AI 等初创公司的早期支持。Meta 的所有 AI 相关工作将统一归属 MSL，涵盖当前所有的大语言模型团队、AI 产品研发、基础研究 FAIR 团队，以及一个正在筹建的全新实验室，用于开发下一代模型。AI产品爆发，但你的痛点解决了吗?o3/o4-mini、GPT-4o、GPT-4.1、GPT-4.5、4o-imagegen 及 Operator 推理框架。

2025-07-02 17:31:25 325

转载巨头开源的背后，是价格战还是价值战？

放眼全球，谷歌在发布其王牌模型 Gemini 2.5 Pro 时，选择开源其衍生的轻量级模型 Gemma，Meta 的 LLaMA 虽名为开源，却始终带着商业限制的“镣铐”……无论你是关注行业趋势的从业者，正在投入大模型应用的创业者，还是期待拥抱下一轮技术浪潮的开发者，这场关于“开源 AI”的深度对话，都值得你来听一听。在这个「开源」时代，我们该如何理解巨头之间的战略分歧，尤其是百度与谷歌这两家以「搜索+大模型」为核心的公司，他们差异的背后反映了怎样的战略思考。一起看懂开源背后的博弈，也看清自己的下一步？

2025-07-02 17:31:25 270

转载写后端也能很 Vibe？一起从 0 到 1 打造你的 AI 应用！

无论你是渴望在 AI 浪潮中找到核心竞争力的 Go 开发者，或是寻求更高效、更可靠开发框架的 AI/LLM 应用开发者，还是对 AI 技术落地充满好奇的后端工程师与架构师，这场直播都将为你解析 AI 原生应用实战细节。我们常常看到一个个惊艳的 AI 应用，想用自己最熟悉的 Go 来复刻，却发现从 Agent 的定义到复杂的任务编排，每一步都充满着挑战，最终产出的“胶水代码”也难以维护和扩展，距离一个优雅的生产级应用相去甚远。当思想与代码碰撞，当 Go 语言遇上 AI Agent，一场精彩的逆袭即将上演。

2025-07-01 15:02:30 295

转载从文心开源谈起，论大模型发展新生态

此架构非常适用于从大语言模型向多模态模型的持续预训练范式，在保持甚至提升文本任务性能的基础上，显著增强多模态理解能力。ERNIE 4.5 即文心 4.5 系列模型，覆盖 47B 和 3B 激活参数的 MoE（混合专家）模型，以及 0.3B 参数的稠密模型，并实现了预训练权重 + 推理代码的完全开源。专注于评测体系构建、工具研发与平台落地，主导智源大模型评测体系的产品化进程，牵头多项核心评测工作，深度参与国内外评测标准制定，致力于推动评测方法的科学化、系统化与国际化发展。6 月 30 日，百度正式宣布开源。

2025-06-30 17:53:37 316

转载腾讯混元开源首个13B激活MoE大模型：推理提升超2倍，单卡可跑！

预训练环节，Hunyuan-A13B 训练了20T tokens的语料，覆盖了多个领域。未来，混元计划推出多尺寸混合推理模型，从0.5B到32B的dense模型，以及激活13B的MoE模型，适配企业与端侧不同需求，混元图像、视频、3D等多模态基础模型及配套插件模型也将持续开源。对于时下热门的大模型Agent能力，腾讯混元建设了一套多Agent数据合成框架，接入了MCP、沙箱、大语言模型模拟等多样的环境，并且通过强化学习让Agent在多种环境里进行自主探索与学习，进一步提升了Hunyuan-A13B的效果。

2025-06-27 17:31:28 377

原创与技术谈实现，与客户谈价值，与高管谈钱！硅谷顶级产品专家亲述生存法则

我期望与我的团队交谈、争论，确保他们真正听进去了我们客户的问题，而不仅仅是看我写在任务单上的文字。我展示这个图的原因是，几乎每周都有CEO打电话给我，希望我能帮他们“让工程团队工作得更快一些”，但这恰恰不是我做的事。我合作过的几乎每一位高管都会给我讲一个我不相信的故事，他们会说：“就这一个月”或者“就这一个季度，我们让那块绿色的部分占到 90%，而不是 50%。这份工作的本质，不是在聚光灯下接受掌声，而是像一位站在音乐厅最后排的父母，默默看着自己的“孩子”（产品）在舞台上大放异彩，内心因骄傲而心潮澎湃。

2025-06-27 09:55:39 1272

转载通往 AGI 之路的苦涩教训

从 AI 1.0 到以 ChatGPT 诞生为标志的 AI 2.0，他见证了人工智能技术的范式飞跃，也更坚定了一种认知：真正的智能，不仅是算得快、答得准，更是对世界的理解与对知识的迁移。早在 2019 年，“强化学习之父”Richard Sutton 发表了著名的《The Bitter Lesson》（苦涩的教训）一文，他指出：过去 70 年，AI 研究最大的弯路就是我们太依赖人类已有的知识与直觉，而历史一再表明，真正能带来突破的，反而是那些“摒弃人类经验、依靠计算规模”的方法。我们走在正确的路上吗？

2025-06-26 19:10:34 308

原创 AI 时代最大的“幻觉”：我们有了最强工具，却正在失去定义真问题的能力

还有一些外部因素，比如我们自己没做什么，但竞品找到了一个很好的切入点，做了一些活动，也会影响我们。而且，我们都知道，做。通过招行案例的演变和美团外卖指标的变化，我们都可以看到，成功的指标制定都是基于用户洞察、着眼于长期价值，并配合相应的策略去执行的。首先，虽然定位和用户心智变了，也带来了新的增量，但如何将这些用户留下来，把产品的核心体验打磨得更好，是一个挑战。另一种方式是，在大部分公司数据资源有限的情况下，就需要增长运营或产品经理自己去分析，通过对比留存用户和流失用户在体验上的差异，找到关键因素。

2025-06-26 09:18:21 863

转载模型训练最重要的依然是 Scaling —— 对话阿里通义千问 Qwen 多语言负责人杨宝嵩 | Open AGI Forum

作者 & 采访 | 唐小引 Echo Tang编辑 | 王诗琪、何苗出品 | GOSIM 开源创新汇近年来，随着大模型技术在全球范围内快速崛起，“出海”成为每家 AI 公司绕不开的话题。在这场激烈的全球竞逐中，阿里巴巴通义实验室研发的通义千问（Qwen）表现尤为抢眼。作为全球开源社区 Hugging Face 上下载量最高的模型之一，Qwen 甚至在欧美用户中收获了超越中文用户的热情拥趸。这种国际化成功的背后，是通义实验室在多语言技术上的深度布局与战略眼光。在法国巴黎举行的 GOSIM AI Paris 大

2025-06-25 14:50:36 304

转载被 AI 大厂逼至绝望，这帮欧洲人发起了一场“科学复兴运动”

作者 & 采访 | 王启隆 Eric Wang出品丨GOSIM 开源创新汇2021 年 1 月，当 OpenAI 的 DALL-E 模型用一串文本便能生成“精彩绝伦的图像”时，整个科技界为之震动。然而，在这片赞叹声中，一种更复杂的情绪正在一群科学家、工程师和爱好者心中悄然发酵——那是一种混杂着敬畏与深刻挫败感的“绝望”。这种绝望，源于一个日益尖锐的矛盾：人工智能领域最前沿、最具革命性的成果，正被越来越多地锁在少数科技巨头的“黑箱”之中。模型不开源，数据集不公开，研究过程无法复现。对于视“可复现性”为基石的科

2025-06-24 15:46:12 257

转载李建忠对话 KK 凯文.凯利：通用智能是个伪命题，AI 不应该模仿人类 | AI 进化论

我曾在全球产品经理大会（PM-Summit）上谈过互联网内容行业的发展规律：从门户时代、到 BBS 和 Blog，再到图片社交，到现在的短视频，整个创作门槛一直在不断降低，互联网的发展为大众带来了海量的内容，内容平台一度成就了互联网上的超级 App，例如 Twitter Instagram WeChat 和 TikTok。它们是自主的，一旦有了自主性和智能，我们就可以称它们为机器人。你得抱着“我们会试，它会失败，我们再试，它还会失败，我们试上十次”的决心，在反复的尝试和失败中，才能最终找到适合你的那条路。

2025-06-23 16:38:55 266

转载 Andrej Karpathy最新演讲刷屏：软件 3.0 时代已经到来！

但现在有了像 Gitingest 这样的工具，你只需要在 URL 里把 github.com 换成 gitingest.com，它就能自动把整个仓库的代码文件、目录结构打包成一个巨大的、结构化的文本块，让你能直接复制粘贴给 LLM。而这些，几乎都不是写代码能解决的，更多的是你一个人在浏览器里“点来点去”的苦活累活。事实证明，像苹果的 Mac Mini 这样拥有大统一内存的设备，非常适合运行某些 LLM，因为纯粹的批处理推理（batch-one inference）是高度内存密集型的。我非常看好这个方向。

2025-06-20 13:50:02 347

原创从 OpenAI 回清华，吴翼揭秘强化学习之路：随机选的、笑谈“当年不懂股权的我” | AGI 技术 50 人

它展示了 DeepSeek 的训练数据是可靠的、训练流程是正确的、算法和基础设施也是可行的。但 Prompt 工程不会消失，它的形式会演化，越来越贴近自然语言，但本质上，它仍然是“把事情表达清楚”的能力。人工智能的浪潮席卷而来，从大模型竞赛到智能体系统的探索，从生成模型到推理模型，技术巨头们纷纷入场，推动着一场“AI 重新定义一切”的时代跃迁。但在这场热潮背后，真正推动技术向前的，从来不是一场场轰动的发布会，也不是那些令人眼花缭乱的融资神话，而是一群敢于直面复杂性、埋头钻研底层机制的工程师与研究者。

2025-06-19 09:44:51 4382 2

转载与“硅谷精神之父”凯文·凯利(KK)对话，聊聊一万天后的 AI 产品

要理解 KK 的思想，我们必须潜入历史的深海，回到那个属于中国互联网的，焦虑与光荣并存的“凯文·凯利时刻”。凯文·凯利的解答，他提出的“自然垄断”、“共同控制”和“涌现”等概念，这种思想的涟漪迅速扩散，其中最知名的信徒，便是微信的缔造者。几年后，这个“名单外”的人，用算法驱动的抖音，对腾讯的社交根基发起了最猛烈的冲击。两年之前，震惊行业的“3Q 大战”落幕，外部舆论汹涌，内部同样暗流涌动。吊诡的是，凯利那套关于“去中心化”、“涌现”、“蜂群思维”的理论，最终在中国，被用来构建了一个个“超级 App”。

2025-06-18 15:56:22 425

转载国产视频大模型霸榜！MiniMax 发布 Hailuo 02，性能超谷歌 Veo3，特效炸裂

在 OpenAI 的 Sora、Google 的 Lumiere/Veo、国内生数科技的 Vidu、字节即梦（Seedance）等模型之后，MiniMax 的 Hailuo 02 也正式加入这场全球视频生成模型的激烈竞赛。2025 全球产品经理大会将汇聚互联网大厂、AI 创业公司、ToB/ToC 实战一线的产品人，围绕产品设计、用户体验、增长运营、智能落地等核心议题，展开 12 大专题分享，洞察趋势、拆解路径、对话未来。02，可创建 10 秒一镜到底的 1080P 视频。

2025-06-18 11:03:38 234

原创硅谷顶尖产品教练万字干货，一针见血揭示产品失败真相

在做产品教练之前，Jim 长期担任科技公司的产品经理和领导者，多次将早期想法发展为成功的产品，例如他曾共同创立 PowerReviews，并以 1.68 亿美元的价格出售。”或者，“嗯，一般般吧。这个结构的好处是，如果你在开发和测试这个产品时，达不到这 10% 的目标，那就说明这个想法可能不太行。所以，你可以想象开发一个功能，比如我上传我的通讯录，Twitter 查看后说：“哦，快看，Jim 刚加入了 Twitter，你应该关注他。或者，假设你是做市场的，目标是拉流量，吸引更多人用你的网站或 App。

2025-06-17 14:19:19 900

转载 MiniMax重磅开源M1模型：百万上下文超DeepSeek R1，实现性能与效率双杀

MiniMax 正式开源其首个推理模型 M1，原生支持百万级上下文长度，在推理效率、计算成本和复杂任务能力上展现出与 DeepSeek R1、Qwen3-235B 等模型不同的技术路径与性能表现。此外，得益于其高效的 Lightning Attention 机制，在生成长度为 10 万 tokens 的场景下，MiniMax-M1 的计算量（FLOPs）仅为 DeepSeek R1。在标准基准测试中，MiniMax-M1 在复杂软件工程、工具使用与长上下文任务等方面表现突出，整体表现已达到甚至。

2025-06-17 10:32:28 242

原创 ‌九章智算云Alaya NeW Cloud 2.0发布，启动全球首个强化学习云平台

6月16日，九章云极DataCanvas发布新一代全栈智能计算云平台——九章智算云Alaya NeW Cloud 2.0，并同步启动全球首个强化学习智算服务。该平台基于Serverless技术架构与强化学习技术的深度融合，成功突破“秒级生成百万token级”的性能瓶颈。

2025-06-16 15:55:14 782

转载 AI 进化风向标，2025 全球产品经理大会首批议题曝光！

他将结合自身十年 AI 产品设计与商业落地经验，深入讲解 vivo AIOS 的设计哲学、“蓝心智能”的体验创新，以及 AIOS 与 HAI（Human-AI Interaction）之间的技术融合与演进思路，呈现 AI 操作系统在终端落地的最新实践与探索方向。来自 YouMind 创始人 & CEO、前字节跳动产品副总裁、语雀创始人将在本次大会上带来《AI 时代的产品，如何有人味》的深入分享，探讨产品在被 AI 快速重塑的当下，从技术赋能走向情感连接，让用户不仅愿意使用 AI，还愿意长期陪伴、持续付费。

2025-06-16 15:42:21 373

原创优快云创始人蒋涛：“码盲”消失，新程序员崛起

今年有一个非常火爆的开源产品，它把一个乐鑫的 ESP32 芯片，跟语言大模型连接起来，后面再接一个豆包大模型。举个最简单的例子，你问所有文生图模型一句话：“给我生成一个青龙偃月刀”，百分之百生成不出来，因为它用的全部是国外的图片和数据，没有中国人自己的数据。最直观的体现，是用户习惯和流量的变迁。它的开发者其实是一个大厂的产品经理，过去他需要依赖程序员，现在有了一个设想，就可以很快地实现出来。我去了一家我投资的公司，他们做的东西都直接用 3D 打印，用一千多块钱的拓竹打印机，就能打印出你想要的各种实体物品。

2025-06-13 15:51:49 751

转载 LeCun亲自官宣！Meta世界模型V-JEPA 2登场！仅用62小时机器人数据，就能实现零样本控制！

在 Epic-Kitchens-100 动作预测任务中，通过冻结编码器和预测器，再训练注意力读出模块，V-JEPA 2 创造了新的 SOTA 纪录。此次，他们不仅开放了 V-JEPA 2 的模型代码与权重检查点，供研究与商业用途自由使用，也希望借此构建起更广泛的开源社区生态，推动世界模型领域的持续进展，加速 AI 与物理世界交互方式的革新。最终，在完全新环境中，V-JEPA 2 在新物体的拾取与放置任务中达成 65%~80% 的成功率，展示了“世界模型”在实现通用机器人智能方面的广阔潜力。

2025-06-12 18:48:35 5359 2

转载揭秘夸克首个高考志愿大模型！蒸馏数百名人类专家经验、Agent 可完整生成志愿报告

6 月 12 日，夸克发布国内首个为高考志愿填报场景开发的高考志愿大模型，并同步上线“高考深度搜索”、“志愿报告”、“智能选志愿”三大核心功能。2025 全球产品经理大会将汇聚互联网大厂、AI 创业公司、ToB/ToC 实战一线的产品人，围绕产品设计、用户体验、增长运营、智能落地等核心议题，展开 12 大专题分享，洞察趋势、拆解路径、对话未来。以通义千问为基座，夸克高考志愿大模型基于领域数据优势，通过专项训练具备对复杂规则与用户需求的理解与推理能力，让模型真正“像志愿专家一样思考与决策”。

2025-06-12 17:07:34 6623

转载 OpenAI 的阳谋与野心！「温和的奇点」背后

如果历史可作参照，我们会找到新的事做，新的东西去渴望，并迅速地接纳新工具（工业革命后的职业变迁就是一个很好的例子）。与 AI 相比，人类有一种长期的、独特的优势：我们的基因决定了我们会关心他人，在意别人的想法和行为，但我们对机器则没那么在乎。（社交媒体的信息流就是一个活生生的例子：那些算法极其擅长让你不停地刷下去，它们很懂你的短期偏好，但它们之所以能得逞，是利用了你大脑的某个弱点，这个弱点会压倒你的长期意愿。但对于那些工作即将消失的群体而言，一个“未来将变得富有”的承诺，能否抚平当下的焦虑与价值感的失落。

2025-06-11 16:31:29 253

转载面壁MiniCPM4端侧模型发布：长文本推理 5 倍提速，0.5B 模型拿下新SOTA

这次行业首例全开源的系统级上下文稀疏化高效创新，具体来说是基于新一代稀疏注意力架构 InfLLM 做了模型创新，并通过自研端侧推理三级火箭，自研 CPM.cu 极速端侧推理框架，从投机采样创新、模型压缩量化创新、端侧部署框架创新几方面，带来 90% 的模型瘦身和极致速度提升，最终实现端侧推理从天生到终生的高效丝滑。此次 MiniCPM 4.0 的发布，是面壁智能持续探索高效大模型道路上的又一重要里程碑，通过多维度、高密度的优化，真正做到行业唯一的端侧可落地的系统级软硬件稀疏化高效创新。

2025-06-10 17:33:21 297

转载当 AI 能写代码修 bug，高考报计算机专业是“火坑”还是“新机遇” ｜深度对话 6 位专家

还是值得报考的，计算机和软件工程，重要的不是写代码，“实现”，还有非常多的基础能力，如数理逻辑、系统结构，其实培养的是一种系统化、科学化的、结构化思考问题、解决问题的能力，这些能力不仅仅在计算机/软件行业更有效，在每个行业未来不确定问题上，都能起到作用。算法、数据结构、系统设计在计算机学习的课程中，就像数学里的四则运算、微积分，物理学里的牛顿定律、热力学定律这些基础理论方法一样，是帮助同学们进入计算机领域的基础知识、培养计算机思维能力，因此，即使在 AI 时代，这些还是计算机领域的基础核心能力。

2025-06-10 17:33:21 259

原创对话 PyTorch 掌门人 Matt White：AI 应用应该做到“润物细无声”

我们想做的是，推动 PyTorch 框架本身的发展，促进全球 AI 研究的进步，并鼓励大家在开源的世界里，把自己的奇思妙想不断变为现实。在当前 OpenAI、谷歌、Meta 等巨头和 DeepSeek 这样的新锐同台竞技的背景下，你如何利用自己的身份，来促进各个开放 AI 项目之间走向合作，而不是“各立山头”？从底层的 GPU、Triton，到上层的 PyTorch、大语言模型，再到应用框架，无论你身处技术栈的哪一层，都要思考：根据我的工作和我需要解决的问题，我该如何驾驭这些新技术？

2025-06-09 18:42:30 1448

转载从「记忆解题」到「深度推理」：港科大推出首个本科数学动态评测基准 UGMathBench

其二是发布定期更新的动态基准。在经研究团队测试推出的榜单中，前 5 名有 4 个为闭源模型，OpenAI-o1-mini 在平均准确率、i=1,2,3 和有效准确率中取得了最佳结果，有效准确率仅为56.3%，且 Δ 为 11.7%，表明其在约 1/5 的问题变体中出错。：分为 8 种原子答案类型和 2 种复合答案类型，答案类型范围从原子类型（例如，数值、表达式）到复合类型（例如，有序或无序列表中的多个答案），使 UGMathBench 与许多其他主要关注具有原子类型的单个答案的数学相关基准区分开来。

2025-06-09 18:42:30 218

转载 Claude Code 首席工程师揭秘 AI 如何重塑开发日常！

嗯，我觉得我看到的高级用户（无论公司内外）开始做的最重要的一件事，就是在让 Claude 开始编码之前，先让它制定一个计划。Claude 会理解你的指令，然后动用它能用的一切工具——比如命令行（bash）、文件编辑等等——来探索代码库，读取文件，获取它需要的上下文信息，然后编辑文件，做出你想要的任何修改。任何你希望 Claude 每次都执行的指令，比如你希望它经常运行的 bash 命令，或者在做修改时它应该重点了解的文件，或者重大的架构决策，诸如此类的东西，都可以放进 `Claude.md` 里。

2025-06-07 17:43:26 2587

原创对话智源王仲远：具身智能“小组赛”才刚刚开打，机器人需要“安卓”而非 iOS

悟道 1.0 发布时，学术界对“大模型是通往 AGI 的技术路线”尚未得出统一结论。现在的具身智能，也处于这个阶段。作者 | 王启隆出品丨AI 科技大本营（ID：rgznai100）大模型的热潮之下，一种微妙的瓶颈感，正成为行业共识。“过往所说的 ‘百模大战’，更多是大语言模型的竞争，” 智源大会前夕，智源研究院院长王仲远在与优快云的对话中，开门见山地指出了问题的核心，“而大语言模型受限于互联网数据的使用，性能虽然还在提升，但速度已大不如前。”出路何在？在王仲远看来，AI 要突破天花板，就必须在“读万

2025-06-07 17:43:26 3220

转载 “AGI 五年内或将实现”：AI 教父 Bengio 呼吁中美达成共识，警惕 AI 沦为人类武器

三是目标，它必须有自己的目的。在题为《如何从失控的 AI “心智”中拯救人类的未来》的主旨演讲中，他直言：具备行动能力的 AI 一旦失控，可能引发系统性灾难，输家只会是全人类。那一刻，我下定了决心：我要调整我的研究方向，改变我所有的工作重心，把全部的精力投入到一个目标上——尽我所能去降低这项技术可能带来的风险。但也不免让人隐隐担忧：当我们满心期待 AGI 时代的到来，畅想着 AI 能帮我们解决一切难题时，另一个更棘手的问题也在浮现——如果有一天，它不再听从人类的指令，那该由谁来“踩刹车”？

2025-06-06 18:19:01 5649 1

转载强化学习之父Richard Sutton：人类数据耗尽，AI正在进入“经验时代”！

2025 全球产品经理大会将汇聚互联网大厂、AI 创业公司、ToB/ToC 实战一线的产品人，围绕产品设计、用户体验、增长运营、智能落地等核心议题，展开 12 大专题分享，洞察趋势、拆解路径、对话未来。虽然目前的大语言模型作为一种强大的“世界知识接口”已经非常出色，但只有具备持续学习的能力，才能真正释放“经验时代”的全部潜力。2、一个智能体的智能程度，取决于它能否有效预测与控制感官输入，也就是能否准确地预判环境反馈，并采取相应策略——这一能力，才是 AI 和智能的本质。我今天想传达几个观点，这些内容与。

2025-06-06 18:19:01 273

转载 Cursor 1.0 正式发布：AI 代码编辑器进入“自动审查 + 记忆”时代！

Cursor 1.0 首次引入 Memories (记忆功能)，这是一项 Beta 特性，可在项目级别存储对话中的知识点与上下文信息，并在未来自动调用。当发现问题时，BugBot 会自动在 PR 中发表评论，开发者可点击 “Fix in Cursor” 一键跳回编辑器，由 AI 预填修改建议。2025 全球产品经理大会将汇聚互联网大厂、AI 创业公司、ToB/ToC 实战一线的产品人，围绕产品设计、用户体验、增长运营、智能落地等核心议题，展开 12 大专题分享，洞察趋势、拆解路径、对话未来。

2025-06-05 10:23:23 327

认知智能技术与产业研究报告2023

2018 AI开发者大会全日程

空空如也