Исследователи представили систему, которая автоматически генерирует экспертный код для научных задач и уже обходит людей на профессиональных лидербордах. Это не просто ещё один генератор кода, а инструмент, который способен думать как учёный и создавать решения, до которых человеческий разум порой не может дойти самостоятельно.
Система построена на LLM Gemini и управляется алгоритмом древовидного поиска (Tree Search). В отличие от простого компилирования кода, ИИ итеративно улучшает существующие решения, стремясь максимизировать конкретную метрику качества («score») на реальных данных. Учёные называют такие задачи «scorable tasks».
Результаты впечатляют. В биоинформатике (scRNA-seq) система предложила 40 новых методов интеграции данных single-cell, превзойдя лучшие человеческие подходы на OpenProblems. ИИ не просто повторил известный метод BBKNN, а улучшил его, скомбинировав с алгоритмом ComBat (решение, до которого люди бы дошли только после длительных экспериментов).
В эпидемиологии ИИ сгенерировал 14 моделей прогнозирования госпитализаций во время сезона 2024/25, которые стабильно опережали как ансамбли CDC, так и отдельные человеческие модели. Кроме того, система показала SOTA в сегментации спутниковых снимков (DLRSD benchmark), прогнозировании нейронной активности целого мозга zebrafish (ZAPBench), прогнозах временных рядов (GIFT-Eval) и численном решении сложных интегралов, где стандартные библиотеки, например scipy.integrate.quad(), часто терпят неудачу.
Принцип работы системы основан на интеграции существующих решений с генерацией мутаций кода и древовидном поиске оптимальных веток. На каждом шаге выбирается наиболее перспективная стратегия, сочетая улучшение текущего метода с исследованием радикально новых подходов. Система умеет использовать научные статьи: ей можно предоставить PDF с описанием метода, и ИИ реализует предложенный подход. Более того, он способен комбинировать идеи из разных источников, создавая гибридные решения, которые приводят к настоящим прорывам.
Этот инструмент не заменяет учёных, но существенно расширяет их возможности. То, что ранее занимало недели или месяцы, теперь ИИ способен проработать за часы, перебирая тысячи вариантов и выявляя нетривиальные решения, которые ведут к качественному скачку. Для эмпирической науки это один из самых мощных инструментов, когда-либо созданных, охватывающий биологию, медицину, климатологию, астрофизику и многие другие области.
Источник: Хабр
Комментариев нет:
Отправить комментарий