Deepseek, det kinesiska AI-företaget som har fått uppmärksamhet för att erbjuda ett lågkostnadsalternativ till OpenAI, har meddelat en tillfällig avstängning av API-tjänsterna på grund av hög efterfrågan.
Beslutet kommer som som Företaget kämpar med serverkapacitetsproblem och lämnar utvecklare osäkra på tillgång till dess allmänt använda modeller. Begränsningen, som förhindrar nya kreditköp för API-användning, har ökat befintliga oro över långsamma inferenshastigheter, säkerhetsrisker och reglering av granskning kring Deepseeks expansion på västra marknader.
Deepseek fryser API-kreditköp För att undvika ytterligare störningar
på sin officiella webbplats bekräftade Deepseek att det har stoppat API-top-ups till Förhindra bredare serviceinstabilitet, även om befintliga krediter kommer att förbli användbara.
Statat det företaget Statat , “På grund av aktuella serverresursbegränsningar har vi tillfälligt avbrutna API-tjänsten laddas för att förhindra eventuell påverkan på din verksamhet. Befintliga saldon kan fortfarande användas för samtal. Vi uppskattar din förståelse!”
Även om ingen officiell tidslinje för upplösning tillhandahölls, signalerar upphängningen som Deepseek kämpar för att hålla jämna steg med den överväldigande efterfrågan som följde sin modells snabba antagande.
DeepSeek’s AI models have been widely adopted due to Deras överkomliga priser, med många nystartade företag som växlar från OpenAI: s GPT-modeller till Deepseek för kostnadsbesparingar. Den tillfälliga frysen på kreditköp tyder på att företagets serverkapacitet inte skalar tillräckligt snabbt för att möta utvecklarens efterfrågan.
U.S.
API-top-up-suspensionen lägger till pågående svårigheter som amerikanska baserade utvecklare försöker integrera Deepseeks AI. Kostnadseffektivt alternativ till Anthropic och OpenAI har prestationsproblem plågat antagande.
Neal Shah, VD för Counterforce Health, hade redan stött på stora vägspärrar före suspensionen. Hans företag, som använder AI för att hjälpa patienter att bestrida nekade försäkringsanspråk, försökte driva Deepseeks modeller genom flera molnleverantörer.
“Vi är på vår sjunde leverantör,”sa Shah till Business Insider .-Distill-llama-70b/leverantörer”> Deepseeks modeller har körts med avsevärt minskade hastigheter På tredjeparts molnleverantörer i USA, som bara arbetar med en tredjedel av den avsedda hastigheten i de flesta fall.
Deepseeks eget API står inför ihållande instabilitet
utvecklare som tidigare förlitade sig på på Deepseeks ursprungliga API som lösning för långsamma molntjänster stod redan inför problem redan innan avstängningen av top-ups. Den 26 januari gick Deepseeks API offline efter vad företaget beskrev som en”skadlig attack.”
För nystartade företag som Ping, en AI-utvecklingsplattform, orsakade störningen stora bakslag. founder Theo Browne hade testat Deepseeks modeller i månader Innan utbredd adoption ledde till API-instabilitet.
“De flesta företag erbjuder en riktigt dålig upplevelse just nu,”sa Browne till Business Insider .”Det tar 100 gånger längre tid att generera ett svar än någon traditionell modellleverantör.”
Även om DeepSeek sedan delvis har återställt tillgång till sitt API, fortsätter utvecklarna att rapportera inkonsekvenser, med långsamma inferenshastigheter som gör realtidsapplikationer tillämpningar Nästan oanvändbar. och regleringsproblem Compound Deepseeks utmaningar
Även innan API-frysningen, hade säkerhetsrisker och reglering av granskning gjort att vissa företag tvekade att anta Deepseeks modeller. över datasäkerhet och potentiellt missbruk, och den amerikanska marinen har antagit liknande begränsningar.
Pukar Hamal, VD för Security Pal, uttryckte tvivel om Deepseeks livskraft för företagskunder.
“Jag driver ett säkerhetsföretag så jag måste vara superparanoid,”sa Hamal till Business Insider. “Det ögonblick som en start vill sälja till ett företag, vill ett företag veta hur ditt exakta dataarkitektursystem ser ut. Om de ser att du starkt förlitar dig på en kinesisk tillverkad LLM, är det inget sätt att kunna sälja det.”
En gemensam studie av Cisco och University of Pennsylvania fann det Deepseeks chatbot misslyckades 100% av säkerhetstesterna för att förhindra AI-jailbreaks. Cybersecurity Exploits.
Under tiden har Italiens dataskyddsmyndighet, Garante, inlett en utredning av huruvida DeepSeek följer GDPR-datalagar, särskilt när det gäller gränsöverskridande dataöverföringar. > Microsoft och OpenAI drar nytta av Deepseeks kamp
när Deepseek kämpar med serverinstabilitet och API Begränsningar, branschgiganter OpenAI och Microsoft utnyttjar situationen genom att stärka sina egna AI-erbjudanden medan de granskar Deepseeks praxis.
Microsoft har tagit en dubbel inställning till Deepseeks uppgång. Modeller, Microsoft har också börjat undersöka med OpenAI om Deepseek kan ha missbrukat OpenAI: s träningsdata i sin utveckling Process.
OpenAI har svarat mer aggressivt genom att lansera O3-Mini, en billigare och effektivare AI-resonemangsmodell utformad för att förhindra att utvecklare byter till Deepseek på grund av prissättningsproblem. Flytten ses allmänt som en förebyggande insats för att undergräva Deepseeks marknadsöverklagande.
Under tiden har SoftBank distanserat sig från Deepseek och tillkännagav att den har pausat sin användning av företagets modeller medan de skiftade resurser till sina årliga 3 miljarder dollar årliga år Investeringar i OpenAI. Beslutet återspeglar en bredare tveksamhet bland stora företag att anta kinesiska AI-modeller på grund av reglerande osäkerhet och säkerhetsproblem.
Regulatory Investigations riktar sig till Deepseeks AI-infrastruktur
bortom bortom utöver API-suspensionen, Deepseek står också inför ökad reglerande granskning. Amerikanska tjänstemän undersöker om DeepSeek har kringgått exportbegränsningar för att förvärva högpresterande AI-chips genom tredje parter i Singapore.
Enligt nuvarande amerikanska föreskrifter kan kinesiska företag inte lagligt köpa NVIDIA: s H100 GPU: er, som är viktiga för utbildning och utbildning och operera stora AI-modeller. Rapporter tyder emellertid på att Deepseek kan ha erhållit dessa chips genom indirekta leveranskedjor och väckt frågor om kryphål i amerikanska exportkontrollpolicyer. AI Market, där företag som Deepseek utvecklar helt oberoende AI-ekosystem, vilket gör lagstiftningsövervakning ännu svårare.
moln Leverantörer och utvecklare anpassar sig till DeepSeeks begränsningar
Trots Deepseeks pågående tekniska kämpar letar molnleverantörer och AI-startups fortfarande efter sätt att integrera sina modeller-men med ökande försiktighet.
AI Hardware Company Groq, som positionerar sig som en konkurrent till NVIDIA, har valt att använda Deepseeks resonemangsmodell för att förbättra Metas Llama Ai istället för att köra Deepseeks modeller naturligt.
(GROQ är specialiserat på språkbehandlingsenheter (LPU), som skiljer sig från NVIDIAs grafikbearbetningsenheter (GPU). I augusti 2024, groq höjde en imponerande 640 miljoner dollar I en serie D-finansieringsrunda under ledning av BlackRock Private Equity Partners.)
Under tiden, en AI-molninfrastrukturleverantör, har testat olika Distributionsmetoder för att optimera Deepseeks inferenshastighet . VD Tuhin Srivastava avslöjade att före Deepseeks API-avbrott den 26 januari var Basetens distribution faktiskt snabbare än Deepseeks eget ursprungliga API.
på Hyperbolic Labs, ett AI-molninfrastrukturföretag, berättade CO Jasper Zhang till Business Insider att Inferens användare ökade ökningen med 150% efter att ha lagt till Deepseek-modellerna, medan de totala nya användarregistrerna ökade med 400% bara i januari. Siffrorna tyder på att trots tekniska begränsningar förblir efterfrågan på överkomliga AI-modeller hög.
utvecklare letar efter alternativ när Deepseeks framtid förblir osäker
medan vissa företag är Försöker arbeta runt Deepseeks begränsningar överväger andra att flytta bort från det helt. Den tillfälliga avstängningen av API-tjänsterna har lett till frågor om Deepseeks långsiktiga tillförlitlighet, med vissa utvecklare som är rädda för att dessa problem kan bli återkommande problem.
för applikationer som inte kräver låg latensprestanda , utvecklare är fortfarande villiga att arbeta med Deepseeks modeller. Till exempel sade Neal Shah från Counterforce Health att små förseningar i behandlingen av försäkringsanspråk är hanterbara. För AI-applikationer som kräver realtidssvar, till exempel automatiserad kundservice eller röstinteraktion, förblir Deepseeks långsamma inferenshastigheter en viktig vägspärr.
Shah utvecklar också ett AI-driven verktyg som kommer att kalla försäkringar Företag för patienter, ett användningsfall som kräver AI att arbeta med mänsklig konversationshastighet. Om DeepSeeks API-hastigheter och stabilitet inte förbättras, säger Shah att hans företag måste byta till en annan leverantör.
Deepseeks tillfälliga avstängning av API-tjänsten är mer än bara ett tekniskt problem-det återspeglar djupare djupare Infrastrukturutmaningar i AI-industrin. När efterfrågan på stora språkmodeller ökar måste AI-leverantörer kunna skala sin infrastruktur utan att offra prestanda.
Dessutom, eftersom regeringens ingripande i AI-infrastruktur intensifieras, måste företag som Deepseek navigera i en komplex regleringsmiljö. Medan vissa beslutsfattare hävdar att begränsa kinesiska AI-modeller är en nationell säkerhetsprioritet, oroar andra att blockering av AI-åtkomst helt kan leda till teknisk isolering, vilket gör globalt samarbete svårare.
För tillfället förblir Deepseek en lågkostnad Men instabilt alternativ för startups. Om det kan lösa problem med skalbarhet, säkerhetsrisker och regleringsproblem kan det bli en allvarlig konkurrent till OpenAI och Anthropic. Men om API-instabilitet och amerikanska handelsbegränsningar kvarstår kan dess närvaro på västra marknader vara starkt begränsad.