Daily Notes — 2026-04-02
线性基因组的终结与泛基因组的算力墙
放弃单一线性参考基因组,转向高维图谱泛基因组(Pangenome),是系统生物学不可逆的结构演进。但别指望它立刻带来临床突破。极度的数据稀疏性和图映射(Graph mapping)的算力瓶颈,正把下一代精准医疗死死挡在门外。
Key Signals
Beyond the Linear Genome: The Transition to Population-Aware Systems Biology
Why it matters: 过去二十年,人类基因组学建立在单一线性参考基因组(如GRCh38)的残缺地基上。这种一维字符串模型天然排斥人类群体的结构性变异(SV),导致严重的“参考偏差”(Reference Bias)——患者特有的基因序列如果不在参考基因组中,测序数据就会被直接丢弃。泛基因组用图结构重构地基,节点代表序列,边代表变异。这是对生物多样性最真实的数学表达。
Key insight: 临床转化的核心卡点不再是测序成本,而是算法和算力。在单细胞多组学中,单细胞RNA测序本身存在极高的“丢弃率”(Dropout rate),数据极度稀疏。当研究人员试图将这些稀疏且充满噪声的短读长(Short-reads)数据映射到高维的泛基因组图谱上时,现有的插补(Imputation)算法根本无法收敛。
现有的线性比对工具(BWA、Bowtie)在图结构面前完全失效。序列比对从简单的字符串匹配,变成了在庞大图网络中的寻路问题(Path-finding)。图映射算法(如vg)消耗的内存和算力,远超常规临床实验室的承受极限。同时,多组学降噪和批次效应校正(Batch-effect correction)在图模型下依然缺乏成熟的数学工具。
What it means: 明确一点:泛基因组目前是一个计算科学问题,还不是一个临床医学问题。算力墙不破,精准医疗的升级就无从谈起。
对于VC和PE来说,现在去投基于泛基因组的Biotech管线公司,风险极高,大概率是在为资本炒作买单。资金应该向上游走,投向解决图算法效率、多组学降噪和批次效应校正的计算生物学基建(Bio-IT Infra)。只有当图基因组的映射成本降到与今天线性比对相当的水平时,真正的产业拐点才会到来。现阶段,关注那些开发新型图比对算法的AI Infra团队,而不是急于讲新药管线故事的NewCo。
Source: Nature Computational Science · 2026-03-28 · [Biotech, AI Infra, Pangenome]
Worth Watching
托卡马克与高温超导磁体供应链
某头部核聚变初创公司近期测试了新型高温超导(HTS)磁体。磁场强度的提升直接决定了等离子体的约束效率。不要看PR稿里的“净能量增益”预测,盯紧HTS带材的良率和供应链成本。目前REBCO带材的产能根本无法支撑商业化反应堆的建设。带材成本降不下来,托卡马克就是昂贵的物理玩具。
港股Biotech基石投资逻辑生变
港股18A公司的基石投资者正在大换血。美元基金退潮,地方国资和产业资本接盘。估值逻辑从“管线潜力”变成“现金流安全垫”。没有造血能力、纯靠融资续命的Biotech,即使有再好的临床前数据,也拿不到下一轮。BD(商务拓展)能力正在取代纯研发能力,成为决定Biotech生死存亡的核心指标。卖管线求生将成为常态。
量子纠错的硬件开销(Overhead)
逻辑量子比特的演示越来越多,但物理量子比特到逻辑量子比特的转化率依然惨不忍睹。如果纠错开销不能从1000:1降到100:1以内,容错量子计算(FTQC)就永远停留在PPT上。硬件路线之争(超导 vs 离子阱 vs 中性原子)的终局,完全取决于谁先突破纠错效率的物理极限。
This Week vs Last Week
资本市场对“颠覆性技术”的定价逻辑正在发生根本性重构。
上周市场还在为大模型的长上下文窗口(Long Context)欢呼,本周核心关注点已经转向端侧推理成本和KV Cache的内存墙。底层逻辑的转变非常清晰:从“理论上能算什么”回归到“工程上算得起什么”。
生物计算领域同样如此。上周资本还在追捧各种生成式AI蛋白质设计,本周的焦点已经回到泛基因组的底层数据清洗和图映射算法。没有高质量、结构化的底层数据,再庞大的参数量也只是在拟合噪声。
算力和数据的物理约束,正在无差别地刺破各个前沿领域的估值泡沫。不要为远景买单,为解决当前工程瓶颈的基础设施买单。