贝叶斯X非线性：基于动态因果的复杂系统自动建模方法

日期：2025-09-09 19:42:37 / 人气：125

研究背景

在神经科学领域，理解大脑各区域间的因果关系对揭示脑功能机制至关重要。大脑网络动态活动复杂，需要既考虑因果性又包含非线性的模型来刻画脑区互作，动态因果建模（DCM）应运而生。它利用大脑生理动力学模型和贝叶斯推断，从脑成像数据（如EEG/MEG或fMRI）中估计不同脑区之间的有效连接关系。然而，DCM的模型推断面临诸多挑战。

DCM模型推断的挑战

计算复杂

DCM建立在生物物理动力学方程之上，通过模型反演估计方程参数的后验概率分布。由于模型通常是非线性且维度较高，直接求解精确的后验分布常常不可行，计算量巨大。

传统推断方法有缺陷

变分推断（VI）：传统上采用变分推断来近似后验分布，将求解高维积分问题转化为优化问题以降低计算成本。但当真实后验是多模态分布时，变分近似难以同时捕获多个解，可能低估模型不确定性，忽略其他可能的解，无法给出可靠的置信区间。
马尔可夫链蒙特卡洛（MCMC）采样：早期用随机游走、切片采样等无梯度采样算法，难以高效探索复杂模型的参数空间。后来转向利用梯度信息的MCMC算法，如Langevin动力学采样和哈密顿蒙特卡洛（HMC），但HMC在DCM复杂非线性动态模型上也面临挑战。每次采样迭代需数值解ODE并计算梯度，计算开销巨大，且算法本身有需要人工设置的超参数，设置不当会导致采样无法充分探索空间或数值不稳定发散。即使是自适应变体无U转采样器（NUTS），在处理非线性微分方程、参数高度相关、观测不完备情形时，也可能出现收敛缓慢甚至无法收敛的问题，还会出现多模态的后验分布，导致重复实验给出不同参数解集，难以判断正确解，浪费计算资源。

新方法：概率编程结合DCM贝叶斯推断

概率编程语言的优势

新研究利用概率编程语言（PPL）实现DCM模型的自动化推断。PPL将传统编程结构与概率模型描述相结合，研究者可用高层代码方便定义复杂统计模型，底层自动完成梯度计算、采样推断等繁琐工作。常见的PPL如Stan、PyMC和NumPyro等，内置高效算法，针对复杂模型和大型数据进行了性能优化，具有灵活、高性能、可扩展的优点。

具体实现与优化策略

利用JAX库：作者将DCM的神经动力学模型用多个主流概率编程平台实现，利用JAX库提供的自动微分和GPU加速功能，使采用HMC - NUTS算法进行采样时，每单位时间获得的独立有效样本数显著提高，在JAX支持的NumPyro等框架中，同样复杂度的模型可以更快收敛并取得更多后验样本。
三项关键策略
- 优化采样超参数：细致调整NUTS采样器的算法参数，避免轨迹过短或过长，充分探索后验分布。
- 广泛的初始值设定：将多个平行马尔可夫链的起始点随机置于参数先验分布的尾部，增加链与链之间的多样性，提高找到全局最优解的概率。
- 基于预测性能的加权堆叠：采用后验堆叠方法，计算每条链生成的模型对观测数据的预测准确性，根据预测指标给予链结果不同权重，再加权融合，突出可信度高的解，获得更精确稳健的综合后验分布。

研究结果

推断效率提升：借助PPL框架和自动微分，高级采样算法在单位时间内获取的有效样本显著增加，有效样本数/时间提高了一个数量级以上，缓解了采样方法“计算慢”的瓶颈。
解决多解不确定性：通过调优采样参数、随机初始化和结果堆叠，克服了后验分布的多模态问题，所有并行链几乎都能收敛到正确的全局解，推断出的参数能良好拟合数据且更接近生成真值，增强了推断结果的可靠性。
验证推断方法一致性：研究发现，只要算法得当，MCMC采样与变分推断最终可趋同于同一个后验分布，对模型证据的评估高度一致，为研究者提供了信心，也说明该DCM模型推断问题在充分计算支持时解的确定性更强。
跨平台可复现实现：作者在多个编程平台上实现DCM推断流程，并将代码开放部署在欧洲人脑计划的EBRAINS云平台上，方便神经成像研究者调用工具进行自动化DCM分析，确保结果可重复验证。

研究意义

新方法让科学家以更低门槛应用DCM分析真实脑成像数据，在研究癫痫等脑网络异常活动和认知神经科学等领域有应用价值。同时体现了跨学科技术融合的威力，概率编程与机器学习领域的发展帮助传统生物数学模型突破计算桎梏，该思路也可应用于系统生物学、生态学等涉及部分可观测非线性动力系统的领域，助力发现复杂系统中的隐藏因果结构和机理。

作者：富联娱乐