登錄
用戶名稱或電子郵件
{{invalid_feedback_email}}
密碼
{{invalid_feedback_pass}}
未找到具有此類憑據的用戶。檢查輸入的數據,然後重試。
忘記密碼?
重置我的密碼
請稍候
完成! 請稍候...
登錄
還沒有賬號?
註冊
發佈
Richard
訓練預算僅 550 萬美元(約港幣 4,290 萬)中國初創公司發表 DeepSeek V3,其技術實力迅速超越 Meta 最新的 Llama 4。
撕開了科技巨頭的遮羞布。
當Meta工程師們正在實驗室里用3930萬H100 GPU小時打磨Llama 3時——DeepSeek-R1僅以266.4萬H800 GPU小時的訓練量(相當於Meta預算的1/15),並在2025 年1月20日交出了6710億參數的超級模型。
#DeepSeek
#meta
3 個月 前
0
0
0
Richard
顯示點讚
添加書簽
複製鏈接
舉報帖子
分享
暫無評論!
看起來這篇文章還沒有任何評論。要回覆
Richard
的文章,請點擊
。
誰值得關注
平台資訊號
396
粉絲
Good Day
396
粉絲
Administrator
360
粉絲
WowBoy
359
粉絲
Big V MCN 網創國際
358
粉絲
您的熱門話題
星島
美團
比特幣
BTC
禽流感
撕破臉
北京
加密資產。
寧德時代
govhknews
rthk港台
RIP
巴拿馬
雞蛋
致香港創業家