Китайская лаборатория ИИ DeepSeek выпустила R1 20 января 2025 года — модель рассуждений с 671 миллиардом параметров (37 миллиардов активных) с открытым исходным кодом. Обученная методом обучения с подкреплением менее чем за $6 млн, R1 сравнялась или превзошла o1 от OpenAI — 79.8% на AIME, 97.3% на MATH-500.
Выпущенная под лицензией MIT, она доказала, что рассуждения уровня фронтира достижимы за малую долю затрат западных лабораторий. Релиз вызвал значительное падение акций американских технокомпаний.