News
得益于大型语言模型 (LLM),我们与数据交互的方式发生了根本性的变化。如果你问你的 AI 助手:“显示第二季度按地区划分的销售趋势”,它几秒钟内就能给出答案。这听起来很令人兴奋,但你很快就会意识到,结果往往是错误的。
自诞生以来,人工智能大模型始终被“幻觉”问题困扰。这里的“幻觉”,指的是大语言模型会将虚构信息当作真实事实输出。实际上,“幻觉”这一表述相当委婉,它实则暴露出AI的核心缺陷——当前的大语言模型尚未达到真正意义上的智能水平。
近日,OpenAI 宣布将旗下的盈利实体从有限责任公司(LLC)转型为“公共利益公司”(Public Benefit Corporation, PBC),并由其非营利母体继续控制这一新结构。这是自它在 2019 年设立盈利子公司以来,再次改变 ...
埃隆·马斯克旗下人工智能公司 xAI 发生重大安全疏漏,其开发者在 GitHub 上意外泄露了一个私有 API 密钥,该密钥在近两个月内持续处于可访问状态。 被泄露的凭证可未经授权访问专为 SpaceX、特斯拉和 Twitter/X ...
正是端侧 AI 能力的提升,以及跨设备跨生态的端边云协同,使得个人可信计算成为可能,也让个人智能的下一步——超级智能体呼之欲出。个人超级智能体正在逐渐进化成个人智能双胞胎的早期形态。
就如一个忠实用户的评论说,“JetBrains 在 AI 方面的表现之差,几乎成了 JB 整体下滑的一个象征。要知道,这家公司过去几十年一直都是最顶尖的,是那种真正了解客户想要什么,并有能力实现它的公司。” ...
对于此次更新,AI编程工具Cursor CEO Michael Truell评价道:「我们对最新的Gemini 2.5 ...
端到端训练将是未来智能体的重要组成部分。虽然手工制作的多 LLM 工作流程可以带来短期收益,但它们在很大程度上依赖于人类的启发式方法,而且无法扩展。相比之下,更通用的方法可以让模型自由探索不同的轨迹(搜索),然后学习这些长期动态。通过与编程环境的交互,模型产生经验流,并通过反馈不断调整。我们希望这样的方法能成为迈向自主编程智能体的第一步。
另有Greyhound Research首席分析师兼CEO Sanchit Vir Gogia补充道, Windsurf优势在于其推理上下文压缩、低延迟设计和模块化微调。 而如今,杀出重围的谷歌凭借Gemini 2.5 ...
AI 编码模型的新王者登基了!今天,Google 旗下的 DeepMind AI 研究部门正式发布了 Gemini 2.5 Pro “I/O” 版,这是今年 3 月推出的 Gemini 2.5 Pro 多模态大语言模型(LLM)的更新版本。 在 ...
刚刚,Google DeepMind 发布了 Gemini 2.5 Pro 的最新更新版本:Gemini 2.5 Pro (I/O edition)。 其最大的进步是编程能力大幅提升,不仅在 LMArena 编程排行榜上名列第一,同时也在 ...
本论文第一作者为微软 DKI 团队的 Chaoyun Zhang,其为 Windows 平台首个智能体系统 ——UFO 的核心开发者,该项目已在 GitHub 上开源并获得约 7,000 Stars,在社区中引发广泛关注。同时,他也是一篇超过 90 ...
Some results have been hidden because they may be inaccessible to you
Show inaccessible results