深度學習如何重塑空間轉錄體學

空間轉錄體學（Spatial Transcriptomics）是近年生醫研究中最令人振奮的前沿領域之一。不同於傳統 bulk RNA-seq 將數百萬細胞的基因表現取平均值，空間方法保留了每個轉錄本在組織中的物理位置。其結果是一張豐富的高維度基因活動地圖，能揭示細胞鄰域、信號梯度，以及過去技術無法觀察到的疾病微環境。

為什麼深度學習很重要

10x Visium 或 MERFISH 等平台產生的數據量極大且結構複雜。每個組織切片可能包含數千個 spot，每個 spot 具有數萬個基因的表現量，並嵌入在二維（或三維）座標系統中。傳統統計方法難以處理如此規模與維度的資料。

深度學習帶來三個關鍵優勢：

表徵學習。 自編碼器與變分模型能將高維表現圖譜壓縮至緊湊的潛在空間，使下游的聚類與軌跡推斷更加可行。
空間感知。 圖神經網路（GNN）將 spot 或細胞視為圖中的節點，以物理距離定義邊。這讓模型能直接推理局部組織結構，而非將每個 spot 視為獨立個體。
多模態整合。 組織切片的 H&E 染色影像攜帶豐富的形態學資訊，與轉錄體數據互補。Vision Transformer 與對比學習框架能融合這些模態，從組織影像預測基因表現或填補缺失的轉錄本。

實務上的挑戰

在這個領域工作，我發現模型在 benchmark 上的表現與實際效用之間的差距可能很大。組織異質性、不同切片間的批次效應，以及真實標註的高昂成本，使得可重現性成為難題。許多已發表的模型在訓練數據上表現優異，但在新的組織類型或實驗流程上泛化能力不足。

此外還有一個本質上的矛盾：我們應該優化預測準確度，還是生物可解釋性？一個完美區分細胞類型的黑箱模型，對生物學家的價值可能不如一個更簡單但潛在維度對應已知信號通路的模型。

未來展望

下一波方法很可能聚焦於在大規模空間數據圖譜上預訓練的基礎模型（Foundation Model），再針對特定組織或疾病進行微調。我們也看到空間多組學的進展，在同一組織切片上結合轉錄體學、蛋白質體學或表觀基因體學。深度學習將是整合這些層次不可或缺的工具。

對我們實驗室而言，當前目標是建構不僅準確，而且足夠可重現、可解釋的模型，以指導濕實驗的設計。這才是真正的價值所在。