/awesome-ai4s

AI for Science 论文解读合集(持续更新ing),论文/数据集/教程下载:hyper.ai

Apache License 2.0Apache-2.0

Awesome AI for Science

从 2020 年开始,以 AlphaFold 为代表的科研项目将 AI for Science (AI4S) 推向了 AI 应用的主舞台。近年来,从生物医药到天文气象、再到材料化学等基础学科,都成为了 AI 的新战场。

随着越来越多的交叉学科人才开始在其研究领域应用机器学习、深度学习等技术进行数据处理、构建模型,加之跨学科研究团队的合作日益加强,AI4S 的能力被更多科研人员所关注到,但却未达到规模化应用的目标。提高相关研究的可复用性、降低技术门槛、提高数据质量等诸多问题亟待解决。

目前,除了高校、科研机构在积极探索 AI4S 外,多国政府及头部科技企业也都关注到了 AI 革新科研的潜力,并进行了相关的政策疏导与布局,可以说 AI4S 已经是大势所趋。

作为最早一批关注到 AI for Science 的社区,「HyperAI 超神经」在陪伴行业成长的同时,也乐于将最新的研究进展与成果进行普适化分享,我们希望通过解读前沿论文与政策的方式,令更多团队看到 AI 对于科研的帮助,为 AI for Science 的发展贡献力量。

目前,HyperAI 超神经已经解读分享了近百篇论文,为了便于大家检索,我们将文章根据学科进行分类,并展示了发表期刊及时间,提取了关键词(研究团队、相关研究、数据集等),大家可以点击题目获取解读文章(内含完整论文下载链接),或者直接点击论文标题查看原文。

本文档将以开源项目的形式呈现,我们将持续更新解读文章,同时也欢迎大家投稿优秀研究成果,如果您所在的团队/课题组有报道需求,可添加微信:神经星星(微信号:Hyperai01)。

AI+ 生物医药

  • 科研团队: 军事医学研究院应晓敏研究团队

  • 相关研究: IPBMC 数据集、dogma-full 数据集、teadog-full 数据集、MMIDAS、self-supervised learning、information-theoretic approaches、深度神经网络、SGVB、单细胞多组学马赛克数据

  • 发布期刊: Nature Biotechnology, 2024.01

  • 论文链接: Mosaic integration and knowledge transfer of single-cell multimodal data with MIDAS

  • 科研团队: 中科院罗小舟研究团队

  • 相关研究: kcat/Km 数据集、米氏常数数据集、pH 和温度数据集、DLKcat 数据集、UniKP 框架、ProtT5-XL-UniRef50、SMILES Transformer model、集成性模型、随机森林、极端随机树、线性回归模型

  • 发布期刊: Nature Communications, 2023.12

  • 论文链接: UniKP: a unified framework for the prediction of enzyme kinetic parameters

  • 科研团队: 梅奥诊所的 James L. Kirkland 博士等人

  • 相关研究: 机器学习、随机森林模型、5 倍交叉验证、随机森林(RF)模型。发现抗衰老药物 Ginkgetin、Periplocin 和 Oleandrin

  • 发布期刊: Nature Communications, 2023.06

  • 论文链接: Discovery of Senolytics using machine learning

AI+ 医疗健康

  • 科研团队: 上海交通大学贾伟平、李华婷和盛斌教授团队,清华大学黄天荫研究团队

  • 相关研究: SDPP 数据、DRPS 数据、ResNet-50、眼底模型、自监督学习、 IBS 评估模型、元数据模型、组合模型。将临床应用的平均筛查间隔从 12 个月延长至 31.97 个月

  • 发布期刊: Nature Medicine, 2024.01

  • 论文链接: A deep learning system for predicting time to progression of diabetic retinopathy

  • 科研团队: 伦敦大学学院和 Moorfields 眼科医院的在读博士周玉昆等人

  • 相关研究: 自监督学习、MEH-MIDAS 数据集、EyePACS 数据集、SL-ImageNet、SSL-ImageNet、SSL-Retinal。RETFound 模型预测 4 种疾病的性能均超越对比模型

  • 发布期刊: Nature, 2023.08

  • 论文链接: A foundation model for generalizable disease detection from retinal images

AI+ 材料化学

  • 科研团队: 谷歌 DeepMind 研究团队

  • 相关研究: GNoME 数据库、GNoME、SOTA GNN 模型、深度学习、Materials Project、OQMD、WBM、ICSD

  • 发布期刊: Nature, 2023.11

  • 论文链接: Scaling deep learning for materials discovery

  • 科研团队: **科学技术大学的蒋彬课题组

  • 相关研究: 场诱导递归嵌入原子神经网络 FIREANN、FIREANN-wF 模型。可准确描述外场强度和方向的变化时系统能量的变化趋势,还能对任意阶数的系统响应进行预测

  • 发布期刊: Nature Communication, 2023.10

  • 论文链接: Universal machine learning for the response of atomistic systems to external fields

AI+ 动植物科学

  • 科研团队: 系统生物学家 Patrick Müller 及康斯坦茨大学研究人员

  • 相关研究: ImageNet 数据集、孪生网络、深度学习、迁移学习、三联体损失训练、迭代训练、分任务训练。在没有人为干预的情况下识别胚胎发育特征阶段点

  • 发布期刊: Nature Methods, 2023.11

  • 论文链接: Uncovering developmental time and tempo using deep learning

  • 主要内容: AI 在同源搜索、多重比对及系统发育构建、基因组序列分析、基因发现等生物学领域中,都有丰富的应用案例。作为一名生物学研究人员,能熟练地将机器学习工具整合到数据分析中,必将加速科学发现、提升科研效率。
  • 科研团队: 马萨诸塞州立大学、康奈尔大学的研究人员

  • 相关研究: 计算机建模、eBird 数据集、马尔可夫模型、Hyperparameter grid search、Entropy calibration、k-week forecasting

  • 发布期刊: Methods in Ecology and Evolution, 2023.01

  • 论文链接: BirdFlow: Learning seasonal bird movements from eBird data

AI+ 农林畜牧业

  • 科研团队: 以色列特拉维夫大学的研究人员

  • 相关研究: 机器学习模型、SVM、Basic、MFCC、Scattering network、神经网络模型、留一法交叉验证。识别准确率高达 99.7%、4-6 天时番茄尖叫声最大

  • 发布期刊: Cell,2023.03

  • 论文链接: Sounds emitted by plants under stress are airborne and informative

AI+ 气象研究

  • 主要内容: 数值天气预报是天气预报的主流方法。它通过数值积分,对地球系统的状态进行逐网格的求解,是一个演绎推理的过程。 2022 年以来,天气预报领域的机器学习模型取得了一系列突破,部分成果可以与欧洲中期天气预报中心的高精度预测匹敌。
  • 科研团队: 西开普大学的研究者

  • 相关研究: CNN、无监督机器学习、Astronomaly、PCA、孤立森林、LOF 算法、iForest 算法、NS 算法、DR 算法。Astronomaly 从异常评分最高的 2,000 张图像中找到了 1,635 处异常

  • 发布期刊: arXiv, 2023.09

  • 论文链接: Astronomaly at Scale: Searching for Anomalies Amongst 4 Million Galaxies

  • 主要内容: 2021 年,达摩院与国家气象中心联合研发了 AI 算法用于天气预测,并成功预测了多次强对流天气。同年 9 月,Deepmind 在《Nature》上发表文章,利用深度生成模型进行降雨量的实时预报。

2023 年年初,Deepmind 正式推出了 GraphCast,可以在一分钟内对全球未来 10 天的气象,进行分辨率为 0.25° 的预测。 4 月,南京信息工程大学和上海人工智能实验室合作研发了「风乌」气象预测大模型,误差较 GraphCast 进一步降低。

随后,华为推出了「盘古」气象大模型。由于模型中引出了三维神经网络,「盘古」的预测准确率首次超过了目前最准确的 NWP 预测系统。近期,清华大学和复旦大学相继发布了「NowCastNet」和「伏羲」模型。

AI+ 天文学

AI+ 能源环境

AI+ 自然灾害

  • 科研团队: 成都理工大学刘瑞研究团队

  • 相关研究: Sentinel-2 多光谱数据、NASADEM 数据、滑坡数据、GLFE、CNN、DSSA、DSC、DTL、Transformer、深度迁移学习。交并比提高了 1.91% - 24.42%,F1 提高了 1.26% - 18.54%

  • 发布期刊: International Journal of Applied Earth Observation and Geoinformation, 2024.01

  • 论文链接: A deep learning system for predicting time to progression of diabetic retinopathy

  • 科研团队: 加利福尼亚大学洛杉矶分校的研究人员

  • 相关研究: 可叠加神经网络、半自动检测算法、additive ANN、SNN、特征选择模型、多阶段训练

  • 发布期刊: Communications Earth & Environment, 2023.05

  • 论文链接: Landslide susceptibility modeling by interpretable neural network

AI4S 政策解读

其他

  • 科研团队: 谷歌 DeepMind 与利物浦足球俱乐部

  • 相关研究: Geometric deep learning、GNN、predictive model、generative model。射球机会提升 13%

  • 发布期刊: Nature, 2024.03

  • 论文链接: TacticAI: an AI assistant for football tactics

  • 科研团队: 清华大学电子工程系城市科学与计算研究中心、清华大学深圳国际研究生院深圳市泛在数据赋能重点实验室、鹏城实验室的研究人员

  • 相关研究: GC 数据集、UCY 数据集、条件去噪扩散模型、SPDiff、GN、EGCL、LSTM、多帧推演训练算法。5% 训练数据量即可达到最优性能

  • 发布期刊: Nature, 2024.02

  • 论文链接: Social Physics Informed Diffusion Model for Crowd Simulation

  • 科研团队: 上海交通大学梅宏研究团队

  • 相关研究: 科学领域大模型、生成式模拟与反演、自主智能无人实验、大规模可信科研协作、AI 科研助手

  • 发布期刊: **科学院院刊,2023.12

  • 论文链接: AI for Science:智能化科学设施变革基础研究

  • 科研团队: 英伟达研究团队

  • 相关研究: 领域自适应技术、NVIDIA NeMo、domain-adapted retrieval models、RAG、supervised fine-tuning with domain-specific instructions、DAPT、SFT、Tevatron、LLM

  • 发布期刊: Journals & Magazines, 2024.03

  • 论文链接: ChipNeMo: Domain-Adapted LLMs for Chip Design

  • 科研团队: 清华大学李勇研究团队

  • 相关研究: 深度强化学习、human–artificial intelligence collaborative 框架、城市规划模型、策略网络、价值网络、GNN。在服务和生态指标上击败了 8 名专业人类规划师

  • 发布期刊: Nature Computational Science, 2023.09

  • 论文链接: Spatial planning of urban communities via deep reinforcement learning

  • 主要内容: 来自斯坦福大学计算机科学与基因技术学院的博士后 Hanchen Wang,与佐治亚理工学院计算科学与工程专业的 Tianfan Fu,以及康奈尔大学计算机系的 Yuanqi Du 等 30 人,回顾了过去十年间,基础科研领域中的 AI 角色,并提出了仍然存在的挑战和不足

  • 论文链接: Scientific discovery in the age of artificial intelligence

  • 科研团队: DeepMind 和威尼斯福斯卡里大学的研究人员

  • 相关研究: I.PHI 数据集、Ithaca 模型、Kullback-Leibler 散度、交叉熵损失函数。文本修复工作的准确率达到 62%,时间归因误差在 30 年内,地域归因准确率达到 71%

  • 发布期刊: Nature, 2020.03

  • 论文链接: Restoring and attributing ancient texts using deep neural networks

  • 科研团队: 香港城市大学的研究人员

  • 相关研究: Predicting NN、深度神经网络。预测准确率达到 99% 以上

  • 发布期刊: ACS Publications, 2022.06

  • 论文链接: Artificial Intelligence in Meta-optics