Tencent mengatakan ia mengurangkan pergantungannya terhadap GPU NVIDIA dengan menggunakan model AI dari DeepSeek yang memberikan kecekapan yang lebih tinggi dengan cip yang lebih sedikit-peralihan syarikat menggambarkan sebagai strategi infrastruktur jangka panjang yang bertujuan untuk mengurangkan kebolehkerjaan dan meningkatkan skalabilitas. Panggilan pendapatan dapat meminimumkan penggunaan GPU sambil mengekalkan output.”[T] dia industri dan kami, dalam industri, semakin banyak produktiviti yang lebih tinggi pada latihan model bahasa yang besar dari GPU sedia ada tanpa perlu menambah GPU tambahan pada kadar yang sebelum ini dijangka,”kata eksekutif itu. Beliau menjelaskan lebih lanjut:

Kejayaan Deepseek benar-benar melambangkan dan menguatkan-menunjukkan bahawa-realiti itu. sumber. href=”https://www.reuters.com/technology/artificial-intelligence/deepseek-rushes-launch-new-i-model-china-oes-all-all-2025-02-25/”sasaran=”_ blank”Termasuk keupayaan multimodal, meningkatkan kegunaannya merentasi kes penggunaan perusahaan.

Model yang lebih baru seperti yang berasal dari Deepseek bukan hanya lebih ringan; Mereka juga dioptimumkan untuk timbunan pengkomputeran Tencent, menjadikannya lebih efisien semasa latihan dan kesimpulan.

Walaupun syarikat itu juga telah melabur dalam pembangunan dalaman-seperti model turbo yang tidak digunakan untuk mendapatkan Malah, syarikat itu dilaporkan telah membuat pesanan besar cip H20 khusus China Nvidia untuk menyokong integrasi DeepSeek merentas aplikasi seperti WeChat, seperti yang terperinci dalam ini

Model meningkatkan prestasi dalam tugas berbilang bahasa dan multimodal tetapi gagal mengatasi model-model khusus penalaran yang lebih kecil seperti O3-Mini dalam domain berstruktur seperti matematik dan logik saintifik. Ini menunjukkan bagaimana pendekatan Tencent-fokus pada kecekapan kesimpulan dan model yang disesuaikan secara tempatan-mungkin menonjol sebagai strategi yang lebih mampan. Kertas penyelidikan baru-baru ini mencadangkan satu kaedah yang dipanggil”Sampel, Meneliti dan Skala”, yang meningkatkan penalaran melalui pengesahan diri kesimpulan.

Model menghasilkan pelbagai output setiap pertanyaan dan pilih yang paling tepat menggunakan mekanisme pemarkahan dalaman. Walaupun ini meningkatkan overhead pengiraan semasa runtime, ia mengelakkan kos belon model pra-latihan besar-besaran dan dilihat sebagai pendekatan yang lebih disasarkan untuk meningkatkan tugas-tugas penalaran.

Bagi Tencent, ini menawarkan laluan untuk skala perkhidmatan AI tanpa overcommitting kepada inventori GPU yang terhad atau terhad. Microsoft baru-baru ini menolak pilihan awan GPU $ 12 bilion dengan Coreweave, yang sebaliknya diambil oleh OpenAI. Perjanjian $ 11.9 bilion termasuk kepentingan ekuiti $ 350 juta oleh OpenAI menjelang IPO CoreWeave. Langkah ini membolehkan Openai mempelbagaikan sumber pengiraannya di luar Microsoft Azure. Syarikat itu juga mengembangkan pengembangan fizikal. Microsoft membatalkan pelbagai pajakan pusat data AI, termasuk kemudahan $ 3.3 bilion di Wisconsin, selepas ramalan permintaan dalaman disemak semula. Penganalisis TD Cowen menyatakan bahawa unjuran penggunaan terbuka yang dikemas kini memainkan peranan utama dalam keputusan itu. Selepas”Sputnik”Moment Deepseek

Kenaikan DeepSeek juga sesuai dengan strategi AI yang lebih luas di China. Sebagai tindak balas kepada sekatan eksport A.S. ke atas cip canggih, banyak firma teknologi Cina beralih kepada model terbuka mereka.

Pendekatan ini membolehkan lelaran yang lebih cepat, menggalakkan penggunaan global, dan mengurangkan kos latihan. Bagi Tencent, mengamalkan model yang lebih terbuka dan kos efektif Deepseek sejajar dengan keutamaan kebangsaan dan operasi ini. Target=”_ blank”>”Sputnik Moment” Untuk industri AI A.S., dengan $ 1 trilion secara ringkas menghapuskan penilaian saham teknologi global berikutan debutnya.

Pemaju Cina sedang membina model AI yang sangat berkemampuan menggunakan cip yang lebih sedikit dan kurang mencabar model kejayaan tradisional berdasarkan semata-mata pada skala dan pengiraan.

Terdapat kaveat. Tencent terpaksa membeli sejumlah besar cip H20 Nvidia untuk mengekalkan penyampaian perkhidmatan, walaupun pengurangan keseluruhan penggunaan GPU. Model-model ini masih memerlukan perkakasan backend yang teguh, dan keupayaan China untuk mengekalkan bekalan tetap tidak menentu di bawah sekatan A.S. yang berterusan.

Walaupun begitu, strategi Tencent menghantar isyarat yang jelas. Kecekapan, bukan pengembangan, menjadi standard baru. Sebagai syarikat teknologi global menilai kos skala dan kerapuhan rantaian bekalan, model seperti DeepSeek R2 menawarkan pelan tindakan yang berbeza: lebih kecil, lebih pintar, dan mungkin lebih mampan.

Categories: IT Info