春风拂过广东省乐昌市三溪镇连绵起伏的山丘,新栽的紫... 【更多】
中国台湾网3月25日讯 3月21日,2025年辽宁... 【更多】
近日珠海市教育局发布公告就《珠海市初中学业水平考试... 【更多】
日前,中央军委训练管理部印发了新编修的《军事体育训... 【更多】
轻点鼠标,案卷材料瞬间被AI拆解为法律要素,证据材... 【更多】
观点网讯:7月28日,中国移动与曙光存储在中国联合... 【更多】
编者按:三湘四水,岂止一面。湖湘大地的版图上,每座... 【更多】
夏秋季节,蚊子不仅扰人清梦,还可能传播登革热和基孔... 【更多】
优化公交线网结构,提升公共交通资源配置的科学性与合... 【更多】
当前,全国已进入“七下八上”防汛关键期,极端天气频... 【更多】
IT之家 4 月 13 日消息,OpenAI、Anthropic 和其他顶尖人工智能实验室的人工智能模型越来越多地被用于协助编程任务,谷歌首席执行官桑达尔・皮查伊在去年 10 月透露,该公司 25% 的新代码由 AI 生成;而 Meta 首席执行官马克・扎克伯格也表达了在公司内部广泛部署 AI 编码模型的雄心壮志。
然而,即便是一些目前最先进的 AI 模型,在解决软件漏洞这一问题上,仍然无法与经验丰富的开发者相媲美。微软研究院(微软的研发部门)的一项新研究表明,包括 Anthropic 的 Claude 3.7 Sonnet 和 OpenAI 的 o3-mini 在内的多款模型,在一个名为 SWE-bench Lite 的软件开发基准测试中,无法成功调试许多问题。
研究的共同作者们测试了九种不同的模型,这些模型作为“基于单个提示词的智能体”的核心,能够使用包括 Python 调试器在内的一系列调试工具。他们给这个智能体分配了一组经过筛选的 300 项软件调试任务,这些任务均来自 SWE-bench Lite。
据共同作者们介绍,即使配备了更强大、更先进的模型,他们的智能体成功完成的调试任务也极少超过一半。其中,Claude 3.7 Sonnet 的平均成功率最高,为 48.4%;其次是 OpenAI 的 o1,成功率为 30.2%;而 o3-mini 的成功率为 22.1%。
为何这些 AI 模型的表现如此不尽如人意?部分模型在使用可用的调试工具以及理解不同工具如何帮助解决不同问题方面存在困难。然而,共同作者们认为,更大的问题在于数据稀缺。他们推测,当前模型的训练数据中,缺乏足够多的“顺序决策过程”数据,即人类调试痕迹的数据。
“我们坚信,训练或微调这些模型可以使它们成为更好的交互式调试器。”共同作者们在研究报告中写道,“然而,这需要专门的数据来满足此类模型训练的需求,例如记录智能体与调试器交互以收集必要信息、随后提出漏洞修复建议的轨迹数据。”
这一发现其实并不令人意外。许多研究都表明,代码生成型 AI 往往会引入安全漏洞和错误,这是由于它们在理解编程逻辑等领域的薄弱环节所导致的。最近对一款流行的 AI 编程工具 Devin 的评估发现,它只能完成 20 项编程测试中的 3 项。
不过,微软的这项研究是迄今为止对模型在这一持续存在问题领域最为详细的剖析之一。尽管它可能不会削弱投资者对 AI 辅助编程工具的热情,但愿它能让开发者及其上级领导三思而后行,不再轻易将编程工作完全交给 AI 来主导。
IT之家注意到,越来越多的科技界领袖对 AI 会取代编程工作的观点提出了质疑。微软联合创始人比尔・盖茨曾表示,他认为编程作为一种职业将会长期存在。与他持相同观点的还有 Replit 首席执行官阿姆贾德・马萨德、 Okta 首席执行官托德・麦金农以及 IBM 首席执行官阿尔温德・克里希纳。
观点网讯:7月28日,中国移动与曙光存储在中国联合启动国内首个智能存力跨域调度平台,旨在为先进存力中心高效运营及AI技术落地提供核心支撑。该平台作为国内首个存力智能调度方案正式落地,定位为存力中心的"中枢神经",深度融合异构资源调度与AI应用场景需求。免责声明:本文内容与数据由观点根据公开信息整理,
今年上半年,海南众扬新材料有限公司持续发力,完成产值2000万元,这一数字已与2024年全年产值持平,实现了半年赶超去年全年的跨越式增长。在海南众扬新材料有限公司的生产车间,机器轰鸣不停,流水线运转有序,工人们各司其职,一派繁忙景象。作为新材料领域的深耕者,海南众扬新材料凭借技术迭代与市场拓展的双重
每经记者:张韵 黄海 朱成祥 每经编辑:董兴生7月26日,“2025世界人工智能大会暨人工智能全球治理高级别会议”(WAIC 2025)在上海隆重开幕。“数字智能是否会取代生物智能?”大会主论坛上,AI教父杰弗里·辛顿翻开了AI之问的新篇章。技术进化之外,更切实的问题是:AI能否真正嵌入产业与社会,
IT之家 7 月 23 日消息,科技媒体 AppleInsider 昨日(7 月 22 日)发布博文,报道称苹果公司获批一项新专利,表明苹果正探索如何让智能戒指显示通知。IT之家援引博文介绍,该专利名为《带有边缘照明器的电子设备》,含 1.4 万字,详细描述了如何通过边缘设备,在智能戒指等设备上实现
7月21日,记者从2025年“青春武汉 约你同行”在汉百万学子行系列活动全国重点高校专场活动上获悉,武汉青年人才之家为来汉创新创业的青年人才提供最长15天免费入住服务,相较之前延长了8天,让大学生有充足的时间了解武汉、爱上武汉。2025年“青春武汉 约你同行”在汉百万学子行系列活动全国重点高校专场活