最新发表在《自然·机器智能》上的一篇论文中,美国普林斯顿大学研究人员详细介绍了一种语言模型,该模型可追踪部分基因组序列并优化这些序列,利用其语义表示能力来设计更有效的信使RNA(mRNA)疫苗。
新模型的代码包含所有生命功能的指令。基因组中每个序列都遵循复杂的语法和句法,这些结构产生了意义。正如改变几个单词可从根本上改变句子含义,生物序列的微小变化也可使序列编码产生巨大差异。
科学家将遗传信息的流动总结为“生物学中心法则”:信息从DNA转移到RNA再到蛋白质,蛋白质创造活细胞的结构和功能。mRNA在最后一步(称为翻译)将信息转化为蛋白质。mRNA只有一部分包含蛋白质代码,其余部分不进行翻译,但控制翻译过程的重要方面。