OpenAI CEO Sam Altman has acknowledged the disruptive impact of DeepSeek’s R1 model, calling it “impressive”and announcing plans to accelerate the release of new OpenAI models.
“We will obviously deliver much better models and also pull up some releases,”Altman wrote on X. His statement highlights the pressure on OpenAI as it faces its first major challenge from a cost-efficient competitor whose achievements have shocked the AI industry.
DeepSeek’s R1 has demonstrated a new level of efficiency in artificial intelligence development, achieving top-tier performance metrics at a fraction of the cost typically associated with advanced models. The company’s app has risen to No. 1 on Apple’s App Store, dethroning ChatGPT.
By relying on just $6 million in resources and 2,000 Nvidia H800 GPUs, R1 has outperformed expectations and set a new standard for what is achievable with limited hardware. The model has outpaced OpenAI’s o1 in several reasoning benchmarks, including a 97.3% score on MATH-500 and 79.8% on AIME 2024.
Related: Alibaba Qwen Challenges OpenAI and DeepSeek with Otomatisasi AI multimodal dan model konteks 1M-Token
Model baru memaksa pergeseran dalam strategi
Respons Altman mencerminkan kekaguman dan urgensi. Sementara dia memuji pencapaian Deepseek, dia juga menegaskan kembali komitmen Openai untuk investasi infrastruktur skala besar.”Lebih banyak komputasi lebih penting sekarang daripada sebelumnya untuk berhasil di misi kami,”Altman mencatat, menekankan keyakinan organisasi pada kekuatan komputasi sebagai dasar pengembangan AI tingkat lanjut.
Tetapi kebanyakan kami sangat bersemangat Untuk terus mengeksekusi pada roadmap penelitian kami dan percaya lebih banyak komputasi lebih penting sekarang daripada sebelumnya untuk berhasil di misi kami.
Dunia akan ingin menggunakan banyak AI, dan benar-benar kagum oleh model gen berikutnya datang.
-sam altman (@sama) Januari, 2025 /a>
Openai yang baru-baru ini meluncurkan Project Stargate Initiative $ 500 miliar, diluncurkan dalam kemitraan dengan SoftBank dan Oracle, menggarisbawahi pendekatan ini, yang bertujuan untuk membangun infrastruktur pusat data yang luas untuk mendukung inovasi AI.
Meskipun demikian Upaya-upaya ini, kemunculan Deepseek R1 telah menimbulkan pertanyaan tentang keberlanjutan strategi intensif sumber daya. Pendekatan lean Deepseek, dikombinasikan dengan penggunaan NVIDIA H800 GPU-versi yang diliputi chip berkinerja tinggi yang dibatasi di bawah kontrol ekspor A.S.-telah menunjukkan potensi untuk optimasi dibandingkan dengan kekuatan komputasi kasar.
Pendiri Liang Wenfeng menjelaskan fokus ini, menyatakan, “Kami memperkirakan bahwa model domestik dan asing terbaik mungkin memiliki celah satu kali lipat dalam struktur model dan dinamika pelatihan. Untuk alasan ini, kita perlu mengkonsumsi kekuatan komputasi empat kali lebih banyak untuk mencapai efek yang sama. Apa yang perlu kita lakukan adalah terus-menerus mempersempit kesenjangan ini”(Sumber: Deepseek).
gejolak-gejolak industri dan reaksi pasar
Rilis R1 telah mengirim gelombang kejutan melalui sektor teknologi global NASDAQ 100 mengalami penurunan yang signifikan karena pasar keuangan menyerap implikasi dari keberhasilan yang hemat biaya Deepseek. menggambarkan divisi AI mereka berada dalam”mode panik”setelah rilis R1. Diskusi anonim pada platform jaringan profesional Blind mengungkapkan frustrasi internal dengan ketergantungan Meta pada strategi sumber daya dan ketidakefisienan organisasi.
Seorang insinyur mencatat, “Manajemen khawatir tentang membenarkan biaya besar Genai Org. Bagaimana mereka menghadapi kepemimpinan ketika setiap’pemimpin’Genai Org membuat lebih dari biaya untuk melatih Deepseek V3 sepenuhnya?”Posting, mengaitkan bagian dari keberhasilan perusahaan dengan pendekatan sumber terbuka. Detail.
tolok ukur baru untuk efisiensi
Ketergantungan Deepseek R1 pada NVIDIA H800 GPU adalah pencapaian yang sangat penting. GPU ini, yang dirancang untuk mematuhi pembatasan ekspor A.S., fitur kinerja yang dicekik dibandingkan dengan chip H100 NVIDIA di NVIDIA.
Kemampuan Deepseek untuk mencapai hasil kelas dunia dengan kendala ini telah menyalakan kembali debat tentang efektivitas kebijakan A.S. yang bertujuan membatasi akses China ke teknologi canggih. Dengan menimbun H800 GPU dan berfokus pada optimasi, Deepseek telah mengubah keterbatasan perangkat keras menjadi keuntungan.
Pendekatan efisiensi-pertama ini meluas ke filosofi Deepseek yang lebih luas. Rilis R1 perusahaan dan seri model Janus berikutnya di bawah lisensi MIT open-source telah memungkinkan kolaborasi dan transparansi global.
Model Janus, yang mencakup kemampuan multimodal canggih, telah melampaui pesaing seperti Openai’s Dall-E 3 dalam tolok ukur generasi gambar
Komentar Altman menunjukkan bahwa Openai beradaptasi dengan kompetitif baru ini lingkungan. Sementara perusahaan tetap berkomitmen untuk investasi infrastruktur skala besar, timeline rilis yang dipercepat menunjukkan pengakuan urgensi yang diciptakan oleh kesuksesan Deepseek.