DeepSeek заявил, что обучение модели R1 стоило всего 294 тыс долларов

Бизнес

Китайский разработчик искусственного интеллекта DeepSeek сообщил, что потратил всего $294 000 на обучение своей модели искусственного интеллекта R1.

Оценка стоимости, впервые раскрытая компанией из Ханчжоу, была опубликована в рецензируемой статье в академическом журнале Nature. В статье сообщается, что DeepSeek использовал 512 чипов Nvidia H800 для обучения модели, ориентированной на рассуждения, в течение 80 часов.

Чипы H800, используемые DeepSeek, были специально разработаны Nvidia для китайского рынка после того, как США запретили экспорт более мощных чипов H100 и A100 в Китай в октябре 2022 года.

В дополнительной информации, сопровождающей статью в Nature, DeepSeek впервые признал, что владеет чипами A100, которые использовались на подготовительных этапах разработки. «Что касается нашего исследования DeepSeek-R1, мы использовали графические процессоры A100 для подготовки экспериментов с моделью меньшего размера», — написали исследователи.

Это раскрытие информации резко контрастирует с заявлениями генерального директора OpenAI Сэма Альтмана, который в 2023 году указал, что «обучение базовой модели» в его компании стоило «гораздо больше» $100 миллионов, хотя OpenAI не предоставила подробных данных о своих релизах.

Оценка стоимости, впервые раскрытая компанией из Ханчжоу, была опубликована в рецензируемой статье в академическом журнале Nature. В статье сообщается, что DeepSeek использовал 512 чипов Nvidia H800 для обучения модели, ориентированной на рассуждения, в течение 80 часов.

Чипы H800, используемые DeepSeek, были специально разработаны Nvidia для китайского рынка после того, как США запретили экспорт более мощных чипов H100 и A100 в Китай в октябре 2022 года.

В дополнительной информации, сопровождающей статью в Nature, DeepSeek впервые признал, что владеет чипами A100, которые использовались на подготовительных этапах разработки. «Что касается нашего исследования DeepSeek-R1, мы использовали графические процессоры A100 для подготовки экспериментов с моделью меньшего размера», — написали исследователи.

Это раскрытие информации резко контрастирует с заявлениями генерального директора OpenAI Сэма Альтмана, который в 2023 году указал, что «обучение базовой модели» в его компании стоило «гораздо больше» $100 миллионов, хотя OpenAI не предоставила подробных данных о своих релизах.

Руководитель бренда шампанского «Вдова Клико» возглавит футбольный клуб
Акции Lifeway Foods обвалились после отказа Danone от приобретения

Также прочитайте

Вам может быть интересно