A Quick Introduction to Synthetic Biology

建模/Model

简介

建模(Model)是 iGEM 项目中实验设计与验证的核心部分。通过建立数学模型与计算模拟,团队能够预测合成生物学系统的行为、优化实验设计并验证实验假设。根据 iGEM 官方 2024 iGEM Judge Handbook 的标准,模型需满足以下要求:

  1. How impressive is the modeling? 即模型创新性。
  2. Did the model help the team understand a part, device, or system? 即体现“设计-构建-测试循环”的工程原理应用。
  3. Did the team use measurements of a part, device, or system to develop the model? 即体现实验与模型间的正反馈。
  4. Does the modeling approach provide a good example for others? 即模型构建过程的完整性,要求模型代码、参数及推导过程在团队 Wiki 页详细公开,便于 iGEM 评委评审与Synbio社群参考

总而言之,需要数学模型出发点新颖、构建过程规范并与项目的推进相互促进。

思路

建模主要分为两个赛道,数学建模与计算生物学。

生物背景下的数学建模主要在优化和预测生物实验,面向底盘生物、最终产物及底盘生物产生产物的过程。以 2024 BNDS-China 项目“缓解肠道失调的益生菌平台”为例,病人通过胶囊摄入将定植于肠道的底盘生物E. coli Nissle 1917,此底盘生物通过融入核心代谢通路模块的基因电路一定程度内介导肠环境中丁酸盐增加和吲哚乙酸减少。因此,我们从药代动力学角度分析了底盘生物在人体内的生长,创建了模拟基因电路功能的计算器,关联底盘生物生长与基因电路功能的半定量的代谢压力模型,并通过计算生物工具分析了通路中核心生物传感器的功能。由此可见,队员需要在深入合成生物并学习数学模型的同时思考团队项目可能遇到的问题。

合成生物学项目中的数学建模还可面向更广的项目背景,如在经济(商队)、社会(IHP)、环境(环保热点如 SDGs )等方面延伸,使项目分析更全面。当项目选题侧重于应用场景而非实现方法时构建这方面的模型更为必要。例如基于传染病模型分析项目针对的病原体的传播,基于偏微分方程分析反应器的反应速率,基于核函数分析植物种子的传播,基于PCA分析调查问卷结果等等。

对于创建数学模型,需要根据模型的应用场景确定核心变量、基本假设、恰当的数学结构、可行的求解方法及合适的模型参数,有兴趣可系统性学习应用数学/数学建模导论课如朱浩楠老师的《数学建模33讲》或 MIT 18.311。考虑到高中生精力和数学水平有限,本文强调基于现有模型的改进和应用而不赘述新模型的创建过程。

生物背景下常见的数学模型可分为评价类、预测类和优化类:

  1. 评价类模型用于衡量和评估某个对象或过程的性能、效果或质量,通过确定一系列指标的权重综合得出最优决策。从评价考试的综合水平、选择既价格又美味的美食到分析问卷调查,评价类问题处处存在。由数据量、指标数量、计算权重难易度常等因素决定,合成生物学项目中构建此类模型常基于层次分析法(AHP)、TOPSIS综合评价法、聚类分析法等算法,用于评估如不同表达量基因的最佳组合、优化合成代谢通路的产物产量和效率、平衡合成生物传感器的特异性和泛用性等问题。
  2. 预测类模型根据历史数据预测未来可能发生的情况或趋势,如近年来爆火的大语言模型,广泛用于语言处理、金融、环科等领域。由数据量、预测尺度、变量间逻辑相关性等因素决定,合成生物学项目中构建此类模型常基于时间序列分析、神经网络、马尔可夫链等预测方法,用于预测如合成蛋白质的三维结构、基因调控网络中基因间的关系、代谢工程策略中网络的各代谢物流量等问题。
  3. 优化类模型用于寻求给定约束条件下的最优解,即以最小的风险换取最大的收益,广泛应用于生产调度、资源配置、物流管理等领域。优化类模型构建需确定决策变量(需要优化的变量)、目标函数(优化的目的)及约束条件(决策变量达到最优状态的限制)。由数以上三者的不同性质决定,合成生物学项目中构建此类模型常基于线性规划、动态规划、遗传算法等优化模型,用于优化如基因合成通路降低成本并提高效率、降低微生物培养成本并提高产物产量、提高生物反应器生产效率等问题。

应用成熟的模型,尤其计算生物模型,可参考文档中的相应文章。

数学建模部分在 Wiki 页的写作应遵循建立的顺序,即简单介绍模型建立的灵感和应用场景、定义变量和参数、模型的基本假设、数学结构、求解方法、模型参数分析(灵敏度分析、鲁棒性分析等等)与结论。不同模型间应通过前后顺序等方法体现明确的逻辑关系。写作应着重。不能假设。

而在计算生物学与生物信息学方面,橡胶数学模型,其更适合辅助项目的选题以及提升湿实验的效率。

例如,网络药理学适用于挖掘蛋白与药物小分子靶点,以此扩展出自己的项目内容(如合成小分子,合成抑制剂等)。分子对接与分子动力学则侧重于预测蛋白-蛋白,蛋白-小分子的结合亲和程度以及稳定性,加以MM/PBSA等算法可以进行绝对自由能的计算。在进行湿实验前首先使用计算生物学进行预测可以极大程度上减轻湿实验的负担。此外,系统生物学构建代谢网络,理性蛋白质优化,蛋白设计等则可以作为项目优化的核心部分。

除开传统的计算生物学,对于酶促反应也有特殊的处理方式。例如,使用反应动力学力场进行蛋白质-小分子反应分析,研究反应机理。或使用量子化学方法进行过渡态搜索,研究中间态与过渡态。

计算生物学与生物信息学的展开是十分自然的,我们在进行蛋白-蛋白或蛋白-小分子体系时便会想到使用分子对接进行机制的研究,接着便会想到使用分子动力学进行稳定性的评估,或对于通道蛋白进行模拟,或是跨膜蛋白的通过。接下来我们会希望研究其中的数据,例如反应可能会使用量子化学或反应动力学方法。接下来我们会希望优化,例如优化酶活我们会希望改造活性位点,提升结合我们会希望有更对的氢键或pi-pi。优化稳定性我们会想到二硫键,去除细胞内可能降低酶活的物质我们会考虑基因敲除以此类推。在这个过程中,有许多的文献可供研究与借鉴。在这个过程中,建模为实验提供优化,实验结果又会回到建模进行处理,分析与进一步优化。

总而言之,项目的建模部分需兼顾理论严谨性与实践可行性,达到 iGEM 评价标准需要:

  1. 建模部分与生物实验、IHP、项目安全性等部分紧密结合。
  2. 考虑建模可行性与创新性的矛盾。iGEM 项目为期不到1年里团队需要从最初的定选题、寻求资金到组织 IHP 活动和开展生物实验,紧张的时间里。如调整模型参数、训练模型、计算生物学工具运行所需的时间。
  3. 关注前沿热点。2023年 BJEA-China 使用 AlphaFold2 模拟 NicX 结构后使用 AutoDock-Vina 获取活性相关残基,通过点突变将其换为性质相反的残基,实验验证成功并取得当年最佳模型奖。这样的建模流程被越来越多高中队学习,如2024年 IEA 通过重训练一个生成式模型生成了适合他们的蛋白。2024年的本科组最佳建模奖得主 Heidelberg 也通过训练模型推进了实验,可见“AI 辅助生物实验”是近年来很热门的建模趋势。
  4. 迭代验证。模型预测与实验数据交叉验证,通过拟合曲线调整参数等方式增强模型鲁棒性。
  5. 文档透明化。在 Wiki 页公开代码、数据及可视化结果,提升评审认可度

案例

2024 IEA

2023 Toronto

上一篇
下一篇

评论区(暂无评论)

我要评论

昵称
邮箱
网址
0/200
没有评论
目录导航

更多文档