
Китайский стартап DeepSeek, который только недавно продемонстрировал большую языковую модель DeepSeek V3, представил новую версию искусственного интеллекта — DeepSeek-R1. Разработчики утверждают, что она не уступает «продуманной» модели o1 от OpenAI по производительности и доступности.
DeepSeek-R1, как и o1, обучался с использованием метода обучения с подкреплением (RL), но DeepSeek говорит, что в дополнение к этому они использовали контролируемую. ..
Читать далее
Свежие комментарии