原文:OpenAI starts offering a biology-tuned LLM
周四,OpenAI 宣布它已经开发出一种专门针对常见生物学工作流程进行训练的大型语言模型。该模型以罗莎琳德·富兰克林 (Rosalind Franklin) 的名字命名为 GPT-Rosalind,它似乎与主要科技公司的大多数以科学为中心的模型不同,这些公司通常采用适用于各个领域的更通用的方法。
OpenAI 生命科学产品负责人王云云在新闻发布会上表示,该系统旨在解决当前生物学研究人员面临的两大障碍。一是数十年的基因组测序和蛋白质生物化学创建的海量数据集,对于任何一位研究人员来说都难以接受。二是生物学有许多高度专业化的子领域,每个子领域都有自己的技术和术语。因此,举例来说,一位遗传学家发现自己正在研究一种在脑细胞中活跃的基因,他可能很难理解大量的神经生物学文献。
Wang 表示,该公司已获得法学硕士学位,并对其进行了 50 种最常见的生物工作流程以及如何访问主要生物信息公共数据库的培训。进一步的培训产生了一个系统,可以建议可能的生物途径并优先考虑潜在的药物靶点。 “我们通过已知的途径和调控机制将基因型与表型联系起来,推断蛋白质可能的结构或功能特性,并真正利用这种机制理解,”王说。
