用戶激增算力不夠? DeepSeek突暫停API服務充值

中國人工智能(AI)初創公司DeepSeek 因「服務器資源緊張」,突然暫停API(應用程式介面)服務充值,引發外界猜測:難道是DeepSeek算力不夠了?

據研究公司 SimilarWeb估計,DeepSeek網站的用戶數量在一個星期內就超過Google的聊天AI Gemini;單在上月31日,DeepSeek.com在美國的日訪問量達240萬次,較Gemini網站多60%,而OpenAI 的ChatGPT 同日1930萬次的日訪問量則是DeepSeek的8倍。

中國AI產品榜統計數據亦顯示,DeepSeek應用程式推出20日,每日活躍用戶已突破2000萬,超越ChatGPT當日推出初期的數字,成為全球增速最快的AI應用。

不過,用戶數字急升可能令DeepSeek算力吃緊,周四(6日)突然暫停其API服務充值,按鈕顯示灰色不可用狀態;DeepSeek其後發表聲明稱:「當前服務器(伺服器)資源緊張,為避免對您造成業務影響,我們已暫停API服務充值。存量充值金額可繼續調用,敬請諒解!」伺服器資源緊張反映現有的計算資源等難以滿足需求,有可能是因為用戶數量暴增或資源分配不合理所導致。

《聯合新聞聯》報道,有用戶抱怨DeepSeek伺服器經常因繁忙而斷線,影響服務品質,甚至無法提供正常回應,「問一個問題要半小時」;網民還拿ChatGPT作對比,認為ChatGPT在免費狀態下仍能快速提供最新的2024年數據,以及迅速製作出表格內容,展現更穩定服務品質;其他人也紛留言「一開始還能用,但現在的狀態真的爛,伺服器算力不足」、「免費的還嫌啊」、「CharGPT 變超聰明,感覺有更新過」。

或只能學OpenAI加大投資基礎設施

《新浪財經》報道,國泰君安分析師推算,假設DeepSeek的日均訪問量為一億次,每次提問10次,而每次提問的回覆要用到1000個token,1000個token大概對應750個英文字母,如果DeepSeek採用的是FP8精度的輝達(NVIDIA,亦稱英偉達)H100高性能GPU做推理,利用率50%,那麼H100顯卡的需求則為16177張,另一輝達A100顯卡的需求為51282張。

分析指出,隨著用戶量持續增加,DeepSeek可能難以滿足需求,如果情況持續,DeepSeek可能別無選擇,只能借鑑OpenAI的做法,加大投資基礎設施。

DeepSeek去年12月26日推出DeepSeek-V3大型語言模型,性能聲稱可媲美 OpenAI和Google等美企旗下的聊天機械人,但用超級電腦訓練聊天機械人動輒要用上至少1.6萬片晶片,DeepSeek卻表示只使用約2000片輝達晶片。

編輯:李向陽(台北) 網編:程皓楠