位置: 首页 > 关于我们 > 行业新闻

关于我们

AI 智能体登 Nature 子刊!华大智造发布靶向测序引物设计工具 PrimeGen




2025 年 7 月 30 日,华大智造杨梦团队联合泰国朱拉隆功大学 Nattiya Hirankarn 教授在 Nature 子刊 Nature Biomedical Engineering 杂志上在线发表文章,发布了名为「PrimeGen」的干湿协同多智能体系统。这也是继该团队在 Nature Machine Intelligence 杂志上发表蛋白自博弈 AI 智能体后,时隔两年再度发表 AI 相关文章。

图片

科学研究的范式革命已然兴起,其前沿图景 ——「自驾实验室」(Self-driving laboratories)—— 正从一个酝酿数十年的构想转变为工程现实。这一理念源于 20 世纪 70 年代的闭环自动化化学,如今在人工智能、机器人技术和高性能计算的驱动下,已演进为能够自主执行「假说 - 实验 - 分析 - 优化」完整科研闭环的智能系统。其颠覆性的潜力使其被权威期刊《自然》列为 2025 年值得关注的七大技术之一,标志着它已从一个长远的技术愿景,演变为正在重塑科学发现范式的核心引擎。尽管自驾实验室在化学合成等领域已取得显著进展,但其在生命科学领域的应用面临着更为严峻的挑战。这不仅源于生物实验固有的高变异性与随机性对过程控制提出的苛刻要求,也因为生物系统内在的计算复杂性(如分子设计中巨大的组合搜索空间)对优化策略构成了严峻考验。

华大智造的 PrimeGen 系统,正是应对这些挑战的强力践行者。该系统以靶向测序引物设计这一复杂生物学问题为突破口,构建了一个由大型语言模型(LLM)协调多个专业智能体(Agent)的先进架构,实现了从用户自然语言输入到 AI 自主完成序列检索、引物设计、机器人协议生成和实验过程监控的端到端完整工作流。它所攻克的靶向测序引物设计,是生物学复杂性的一个典型缩影:其内在的「组合爆炸」难题,要求在指数级增长的潜在干扰组合中寻找最优解,形成一个巨大的、高度约束的离散优化空间,这比许多自动化化学任务更为复杂。

这种将海量组合优化与「干湿实验」深度闭环的工程实践,正是华大智造「实验室智能自动化」(GLI)业务的一个优秀范例。GLI 业务旨在将 AI 技术全面融入生命科技工具,推动实验室从「人工经验」向「数据驱动」的智能范式进化,其最终目标正是通过构建软硬件深度协同、数据驱动决策的闭环系统,将传统的自动化实验室升级为能够自主运行的「自动驾驶实验室」。

在呼吸道流行季,公共卫生实验室面临着与时间赛跑的挑战:需要快速识别流行毒株、追踪传播链并监测耐药性。要实现高效精准的检测,关键在于为目标基因片段设计合适的引物 —— 这相当于为检测系统配制专属「钥匙」。引物与目标序列的关系如同钥匙与锁:必须精确匹配,确保只识别特定目标;同时还要在多重 PCR 反应中,与数百对引物协同工作而不相互干扰。

优质的引物设计需要兼顾多重标准:特异性(避免与非目标位点结合)、退火温度(Tm)匹配等,并尽量避开关键位点(如 3′ 端错配风险)。更大的挑战在于多重 PCR 检测:当反应体系中包含数百对引物时,每对引物既要保持自身的高效性,又要避免与其他引物产生干扰。随着目标数增加,候选组合呈指数级膨胀,而面板中共有 m 条引物时,潜在引物二聚体 / 交叉二聚体的成对检查负担接近 0(m²)。再叠加基因组同源区、重复序列、样本差异等因素,传统的设计方法或单一工具往往需要多次调试,难以在高多重化场景下同时获得高特异性、高均匀性、低二聚体的稳健方案。

PrimeGen 的使命,就是将这一「组合爆炸」的复杂问题,转化为易于使用、可广泛复用的工程化解决方案。系统采用辅助式设计嵌入实验室工作流,研究人员只需用自然语言描述实验目标,即可触发一系列自动化流程,包括目标序列锁定、候选引物与扩增子布局生成、实验协议代码块(APB)组装、液体处理机器人脚本生成、多视角视觉语言模型(VLM)质控、结果回写与参数微调,最终形成完整的实验闭环,同时在关键决策节点仍由人工把控,确保安全性与可控性。 

系统由四大智能体协同运作,各司其职(如图 1 所示):


上游,搜索智能体与引物智能体协同完成目标序列定位和高通量引物布局,确保设计合理、特异性强;中段,协议智能体将设计结果转化为可执行的实验协议代码块(APB,Assembly of Protocol Blocks),以统一策略生成可在不同平台运行的实验脚本,并高度适配多种多重扩增化学体系;下游,实验智能体通过多视角视觉语言模型(VLM)实时监测实验关键步骤,识别潜在异常并记录审计轨迹。得益于这一结构化架构,PrimeGen 即使在高达 955 个扩增子(amplicons)的超高通量条件下,仍能保持优异的扩增均匀性,显著降低引物二聚体风险,从而有效减少重复实验次数、提升实验稳定性,并整体降低时间与成本开销。系统运行周期的具体优化幅度将根据任务规模、人工审校流程与实验组织方式的不同而有所差异。

华大智造副总裁、论文通讯作者杨梦博士表示:「PrimeGen 的突破验证了将先进 AI 智能体与我们的自动化硬件平台(如 AlphaTool)深度融合的巨大潜力,也是华大智造实验室智能自动化业务为科研人员赋能的优秀范例。未来,我们将持续帮助客户打通实验室『干实验』与『湿实验』全链路,构建『设计→执行→优化』的自进化闭环。」

图片

图 1. PrimeGen 功能总览图

 01、Search Agent 搜索智能体

精准锁定目标基因,生物领域的 AI 雷达

传统的基因目标检索需要科研人员耗时耗力地手动查阅数据库。PrimeGen 的搜索智能体能快速理解用户需求,自动从 NCBI 等权威数据库中检索目标序列。无论是病原微生物、癌症、耐药性相关基因与位点,都能通过对话精准检索,能够涵盖大多数高通量测序典型应用场景。

例如,在新冠病毒等流行病原检测的测序任务中,它能快速提取靶标序列的保守区域;在遗传病筛查场景中,它可以智能合并靶标序列的邻近编码区,对引物设计进行整体考虑,避免引物冲突;面对模糊提问时,搜索智能体也能通过「ReAct」机制内部优化检索精度。同时提供人工介入机制(Human-in-the-loop)来保证序列检索结果的可靠性,再将结果传递给引物设计环节。

图 2. 搜索智能体检索目标序列

图 3. 搜索智能体检索路径图

 

02、Primer Agent 引物设计智能体

最小化引物二聚体,优化效率提升 10 倍

引物设计不仅要覆盖目标区域,还需避免引物之间因错误结合而形成的二聚体。PrimeGen 的引物设计智能体开创了「滑动窗口 + LLM 迭代」的双引擎机制:通过滑动窗口筛选引物并严格把控设计参数,基于历史记忆迭代的 LLM 优化器进行引物优化,将二聚体率压到 < 1%。

引物设计智能体在湿实验反馈中,能够实现自动微调参数,无需人工反复调试。PrimeGen 的高性能引物设计能力结合 ATOPlex 多重扩增技术,实现靶标区域的高效扩增。在新冠全基因组测序的应用中,对低拷贝数样本实现 ≥ 99.8% 基因组覆盖(10×);在拓展性遗传性疾病筛查(ECS)应用中, 针对 22 个复杂基因(包含高同源区域等),成功设计 958 重(958-plex)的扩增引物池,其产生的二聚体比率低至 0.9% ± 0.3%,显著领先行业内水平。

图 4. 大模型推理优化引物池示意图

图 5. LLM 驱动 vs 传统算法的引物二聚体优化曲线图

图片

图 6. 搜索与引物设计智能体的真实运行预览

 

03、Protocol Agent 实验脚本设计智能体

实验协议「一键生成」,仪器自动执行

 ?

叶子 135-6489-5879


全国客服

全国客服

欧阳明13122625958


在线客服