滚动资讯

当前位置：网界 > 行业动态 > 正文内容

AI在生物数据前“栽跟头”：网页交互成障碍，新工具能否破局？

时间：2026-06-10 16:24 作者：互联网

当顶级人工智能在编码领域屡创佳绩时，它们在生物学领域却频频受挫。这并非因为模型不够先进，而是科学数据库的设计初衷仅服务于人类操作，导致智能体在数据检索过程中举步维艰。近期，Anthropic公司发布的科研报告揭示了一个令人震惊的现象：即便是最先进的科研智能体，在执行看似简单的病毒序列计数任务时，也难以给出稳定准确的答案。

研究人员选取了Claude、GPT、Biomni和Edison Analysis等知名智能体，要求它们从NCBI Virus数据库中统计符合特定条件的病毒序列数量。结果令人意外：所有模型均无法稳定输出正确结果，同一任务多次执行时，答案差异甚至达到数十倍。以Claude Sonnet 4为例，在三次检索埃博拉病毒序列的任务中，分别返回了106条、15条和5条的结果，而实际正确数量应为266条。

这种不稳定的表现源于生物学数据库的特殊架构。NCBI Virus本质上是一个面向人类的网页门户，其复杂的过滤逻辑隐藏在网页交互层中，并未通过程序接口对外开放。智能体只能调用底层原始API，但这些接口无法完整复现网页端的过滤语义。例如，"采样地在非洲"这一条件，在网页端通过勾选框即可实现，但智能体需要自行处理数十个国家的元数据对齐问题，稍有不慎就会导致数据遗漏或错误。

这种数据检索的不确定性在疫情分析中可能产生严重后果。以2026年刚果（金）爆发的埃博拉疫情为例，研究人员需要比对新病毒与历史基因组数据来评估诊断试剂的有效性和治疗方案的适用性。当使用存在数据遗漏的智能体检索结果进行分析时，疫情起源时间的推算可能出现数十年偏差，抗体疗法有效性评估也会得出完全不同的结论。这种错误在科研领域尤为危险，因为它往往难以被立即察觉。

问题的根源在于科学基础设施的"历史包袱"。生物学数据库如同为马车设计的老城，其窄巷急弯的布局难以适应智能体这辆"汽车"的行驶需求。相比之下，软件领域的数据系统则像专为车辆建造的新城，拥有标准化的道路和交通信号。这种差异导致代码智能体发展迅速，而生物智能体却停滞不前。NCBI Virus的检索流程需要人工在网页上勾选多个条件，这种设计对人类友好，却让智能体难以直接调用。

为解决这一难题，Anthropic与NCBI合作开发了gget virus系统。这个确定性检索层将网页端的过滤逻辑转化为可复现的程序化操作，能够自动判断哪些过滤条件可通过API实现，哪些需要本地校验。该系统支持批量数据完整下载，避免结果被截断，同时将数据传输量压缩超过98%。在测试中，接入gget virus后所有智能体的准确率均提升至90%以上，GPT-5.5的准确率更是达到99.7%，运行稳定性显著增强。

这项突破的意义不仅限于病毒学领域。在生物医学的各个分支，都存在着类似"为人类设计而非为智能体设计"的基础设施问题。当智能体开始大规模参与科研工作时，数据检索的可靠性变得至关重要。gget virus的出现表明，通过构建专门的确定性工具层，即使使用成本较低的模型也能获得稳定可靠的结果。这种解决方案为其他科学领域提供了重要参考，显示出改进数据基础设施比单纯追求模型性能提升更具战略价值。

在360次测试运行中，GPT-5.5曾有一次在未受提示的情况下自动使用gget virus，并取得了唯一正确的结果。这一细节生动展现了工具价值的重要性。当智能体能够依赖稳定的数据检索系统时，科研人员就不必再为数据准确性担忧，可以将更多精力投入到假设生成和实验设计等创造性工作中。这种转变预示着科学研究范式的潜在变革，其影响可能远超单纯的技术进步。

更多>同类内容

从“银河”号屈辱到千帆星座崛起：中国低轨卫星组网加速冲刺

06-10

国产迭代OS抢先苹果实现“AI语音助手上岛” 创意与功能亮点引关注

06-10

比亚迪印尼纯电市场大放异彩，前四月销量近1.71万辆领跑当地

06-10

5月车市新能源热燃油冷：燃油车降价潮起，新能源出口创新高

06-10

燃油宝：新车用是浪费，老车用才有效？一文说清适用场景

06-10

吉利中国星i-HEV混动乌鲁木齐节油赛收官卓越性能实力领跑

06-10

字节跳动AI制药业务独立融资新进展：整合团队资源，字节控股推进产业化

06-10

字节跳动AI骨干西原离职创业，携超亿美元融资再战AI社交新赛道

06-10

AI编程新星Lovable崛起：年化营收破5亿，用户激增挑战传统SaaS行业

06-10

星火医疗大模型V3.5发布：国产算力赋能，助力医疗AI专业化升级

06-10

苹果iPhone国行升级iOS27：AI壁纸扩图上线，个性化体验再升级

06-10

谷歌Gemini3.5Live Translate发布：实时同传打破语言藩篱，沟通更自然流畅

06-10

Lovable“氛围编码”崛起：年化收入破5亿，每周百万新项目引行业热议

06-10

Anthropic推出Claude5系列：Fable 5提效能，Mythos 5筑安全科研新防线

06-10

博通携手阿波罗黑石投350亿美元，AI算力基建迈向“能源密集型”新阶段

06-10

点击查看更多 +

全站最新

钉钉副总裁马锐拉离职发文《置身钉外》谈感悟，发声后遭抹黑引风波

抖音电商达人服务费新规落地：分级定费，直播电商迈入质量深耕新阶段

小红书推出RED Skill功能：创作者可挂载Skill，用户一键复制即用

字节Flow部门AI产品负责人西原离职创业，猫箱成绩亮眼，AI创业潮再添新军

Marshall Stockwell III便携音箱登场：35小时续航+360°环绕声，售价1699元

Anthropic发布两款AI模型：Fable 5面向大众，Mythos 5聚焦科研安全

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号