Logo
Richard Lee
訓練預算僅 550 萬美元(約港幣 4,290 萬)中國初創公司發表 DeepSeek V3,其技術實力迅速超越 Meta 最新的 Llama 4。

撕開了科技巨頭的遮羞布。

當Meta工程師們正在實驗室里用3930萬H100 GPU小時打磨Llama 3時——DeepSeek-R1僅以266.4萬H800 GPU小時的訓練量(相當於Meta預算的1/15),並在2025 年1月20日交出了6710億參數的超級模型。

#DeepSeek #meta
11 天 前

暫無評論!

看起來這篇文章還沒有任何評論。要回覆 Richard Lee 的文章,請點擊