Китайский разработчик искусственного интеллекта DeepSeek сообщил, что потратил всего $294 000 на обучение своей модели искусственного интеллекта R1.
Оценка стоимости, впервые раскрытая компанией из Ханчжоу, была опубликована в рецензируемой статье в академическом журнале Nature. В статье сообщается, что DeepSeek использовал 512 чипов Nvidia H800 для обучения модели, ориентированной на рассуждения, в течение 80 часов.
Чипы H800, используемые DeepSeek, были специально разработаны Nvidia для китайского рынка после того, как США запретили экспорт более мощных чипов H100 и A100 в Китай в октябре 2022 года.
В дополнительной информации, сопровождающей статью в Nature, DeepSeek впервые признал, что владеет чипами A100, которые использовались на подготовительных этапах разработки. «Что касается нашего исследования DeepSeek-R1, мы использовали графические процессоры A100 для подготовки экспериментов с моделью меньшего размера», — написали исследователи.
Это раскрытие информации резко контрастирует с заявлениями генерального директора OpenAI Сэма Альтмана, который в 2023 году указал, что «обучение базовой модели» в его компании стоило «гораздо больше» $100 миллионов, хотя OpenAI не предоставила подробных данных о своих релизах.
Оценка стоимости, впервые раскрытая компанией из Ханчжоу, была опубликована в рецензируемой статье в академическом журнале Nature. В статье сообщается, что DeepSeek использовал 512 чипов Nvidia H800 для обучения модели, ориентированной на рассуждения, в течение 80 часов.
Чипы H800, используемые DeepSeek, были специально разработаны Nvidia для китайского рынка после того, как США запретили экспорт более мощных чипов H100 и A100 в Китай в октябре 2022 года.
В дополнительной информации, сопровождающей статью в Nature, DeepSeek впервые признал, что владеет чипами A100, которые использовались на подготовительных этапах разработки. «Что касается нашего исследования DeepSeek-R1, мы использовали графические процессоры A100 для подготовки экспериментов с моделью меньшего размера», — написали исследователи.
Это раскрытие информации резко контрастирует с заявлениями генерального директора OpenAI Сэма Альтмана, который в 2023 году указал, что «обучение базовой модели» в его компании стоило «гораздо больше» $100 миллионов, хотя OpenAI не предоставила подробных данных о своих релизах.












