Проект Theorizer AI, который читает тысячи научных статей и выводит законы - Главные новости нейросетей

Проект Theorizer AI, который читает тысячи научных статей и выводит законы

admin


28 января 2026 года Allen Institute for AI («Институт искусственного интеллекта Алена» в США) представил Theorizer, фреймворк на базе нескольких больших языковых моделей, который читает научную литературу и автоматически генерирует структурированные теории. Система получает запрос от пользователя («сделай мне теории о X»), анализирует релевантные исследования и выдает утверждения о закономерностях, которые прослеживаются в этих работах, с указанием области их применения.

Разработчики представляют свой проект в качестве способа сориентироваться в новой научной области за минуты, а не месяцы, а также как шаг к автоматизации одной из самых упорно сопротивляющихся механизации частей науки: построения теорий на основе разрозненных находок. Вместе с Theorizer команда опубликовала датасет примерно из 3000 теорий, сгенерированных на основе широкого среза исследований в области AI и обработки естественного языка; для его создания было использовано 13744 исходные статьи.

Нейросеть-«теоретик»

Ученые обычно концентрируют свое внимание на разработке или проверке отдельных теорий, и при этом, как правило, на протяжении длительных периодов времени. Allen Institute задался вопросом: что, если тысячи теорий можно синтезировать одновременно, автоматически анализируя весь массив исследований в определенной области?

Существует множество AI-инструментов для суммаризации статей или подготовки детальных обзоров литературы. Theorizer вместо этого идентифицирует закономерности, паттерны, которые последовательно прослеживаются в нескольких исследованиях, и выражает их как проверяемые утверждения с определенной областью применения и подтверждающими доказательствами. При этом каждая теория, которую выдает система, обладает своей структурой – у нее имеются собственные законы и доказательства, область применения и пр.

Закон представляет собой качественное или количественное утверждение, закономерность, которая, по мнению Theorizer, имеет место быть в теории. Качественный закон может выражать направленную связь наподобие «X увеличивает Y» или «A вызывает B». С другой стороны, количественный закон указывает конкретные числовые границы. Большинство работ в области автоматизированных научных открытий сконцентрированы на экспериментальной стороне. Собственный проект Allen Institute под названием CodeScientist, например, может взять исследовательский вопрос, сгенерировать код для экспериментов, выполнить их и представить кандидатов на звание открытий.

В реальной науке эксперименты обычно служат чему-то более высокоуровневому: построению теорий. Теории консолидируют множество результатов в компактные законы, которые объясняют и предсказывают, именно так области знания консолидируют информацию и делают устойчивый прогресс. Законы Кеплера обобщили многолетние астрономические наблюдения в несколько простых правил движения планет.

Как оценивается работа проекта

Система функционирует на основе комбинации больших языковых моделей и способна находить закономерности, которые не очевидны при поверхностном чтении отдельных работ. Разработчики протестировали различные методы генерации теорий, в том числе использование научной литературы против параметрической памяти модели, и обнаружили, что подход с опорой на литературу создает теории, которые значительно лучше как при соответствии существующим доказательствам, так и при предсказании будущих результатов. Для оценки использовались 4600 статей, написанных уже после генерации теорий. Некоторые методы производили теории, которые в среднем на 90% точно предсказывали результаты последующих научных работ. Это впечатляющий показатель для автоматически сгенерированного контента, хотя и не без оговорок.

Между точностью и новизной

Theorizer позволяет исследователям выбирать фокус генерации: можно запросить теории с упором на точность или на новизну. Эти два направления дают разные результаты. Теории, ориентированные на точность, лучше подтверждаются существующими работами; а теории с упором на новизну предлагают более свежие гипотезы, но с меньшей доказательной базой.

Стоимость и время работы Theorizer нетривиальны: примерно 15-30 минут на один запрос, хотя процесс можно распараллелить. Покрытие зависит от статей в открытом доступе, поэтому система сейчас работает лучше всего в таких областях, как AI и обработка естественного языка. Ошибки тоже возможны: Theorizer может производить частично точные или вводящие в заблуждение теории, поэтому разработчики рекомендуют рассматривать его вывод только лишь в качестве отправной точки для своих исследований. Научное знание растет быстрее, чем кто-либо может синтезировать, и построение теорий остается по большей части ручным процессом. Если автоматизированные системы смогут помочь сжать литературу в структурированные, проверяемые теории, они станут полезным инструментом для осмысления того, что мы коллективно знаем.

Выводы

Как отмечают эксперты Креатор Проджект, проект Theorizer является доказательством того, что ИИ может не только анализировать статьи, но и формулировать обобщающие закономерности на их основе. Пока такие системы требуют проверки и аккуратного использования, однако они уже помогают быстрее ориентироваться в растущем массиве научных публикаций. Они способны заметно изменить то, как исследователи работают с литературой и строят новые гипотезы.



Источник

Вам также может понравиться

Оставить комментарий

Главные новости нейросетей.