Logo
平台新聞號
3 小時 前
#DeepSeek 股權結構曝光—2023年7月,幻方量化宣佈成立大模型公司DeepSeek,正式進軍通用人工智能領域。據報道,DeepSeek包括創始人梁文鋒在內,僅有139名工程師和研究人員。同時,網絡傳出“杭州深度求索人工智能基礎技術研究有限公司”的股權架構圖,DeepSeek的股權結構中四個自然人通過五層關係控股100%,並沒有出現任何VC的身影。
平台新聞號
17 小時 前
中國駐聯合國代表傳聰:看看華為 看看TikTok,現在又有DeepSeek,美國還想禁多少?

“From Huawei to TikTok, and now to DeepSeek—how many more does the US want to impose a ban [on]?”
Good Day
20 小時 前 (E)
🚨 #DeepSeek 釣魚頁面預警
Poly Armour
2 天 前
OpenAI和DeepSeek兩者的開源策略與生態

#OpenAI

早期開源了GPT-2等模型,但近年轉向閉源,通過API(如 #ChatGPT #API )和產品(如ChatGPT Plus)商業化。生態依賴第三方開發者基於API構建應用,控制核心技術。

#DeepSeek

積極擁抱開源,發佈DeepSeek-R1-7B等可商用模型,鼓勵社區協作和行業適配。支持私有化部署,企業可自主訓練優化模型,靈活性更高。
Poly Armour
7 天 前 (E)
#ChinaTech : Chinese AI app #DeepSeek topped the Apple App Store's free downloads in both China and the US on Monday, outpacing #ChatGPT in free downloads in the US.
WowBoy
8 天 前
美股「四巨頭」本周公佈業績之際,正值DeepSeek引領的「低成本算力風暴」席捲全球,投資者們開始質疑美國科技巨頭們對於人工智能堪稱「非理性」的狂熱AI燒錢計劃是否合理。

#美股 #DeepSeek #低成本算力風暴
WowBoy
8 天 前
“ Open AI 也不是神,要有瘋狂的雄心、瘋狂的真誠。 ”

#DeepSeek 創辦人梁文鋒

#梁文鋒
Richard Lee
8 天 前 (E)
27日,美國總統特朗普表示,DeepSeek的出現是一件積極的事情,這是一項積極的技術成果,不用再燒很多錢了。

#DeepSeek #美國 #特朗普
Good Day
9 天 前 (E)
DeepSeek工程師團隊僅用2048塊二手H800顯示卡搭建的訓練基群,以557萬美元的總成本復現GPT-4的性能奇跡。模型架構優化:稀疏注意力機制將計算量削減40%,動態計算圖減少冗餘參數15%;訓練策略革命:梯度累積技術降低顯存佔用30%,混合精度訓練提速1.8倍。
#DeepSeek #人工智能 #大模型
Richard Lee
9 天 前 (E)
恐怖的性價比: #DeepSeek 推理成本僅每百萬token 0.14美元( #OpenAI 為7.5美元),相當於用拼多多的價格提供愛馬仕的品質。
#人工智能
平台新聞號
9 天 前 (E)
DeepSeek通過結構化稀疏注意力
,混合專家系統、動態計算路由等技術,顯著降低了模型訓練和推理的算力消耗;算力硬件股份英偉達股價大跌,蒸發市值規模創美股歷史紀錄,股價週一開盤後一度下挫13%,市值蒸發約4,650億美元。
#DeepSeek #探度求索 #nvidia #英偉達 #美股 #人工智能
WowBoy
9 天 前
Semi Analysis 首席分析師認為,DeepSeek V2論文“可能是年內最好的一篇”。OpenAI前員工Andrew Carr認為論文“充滿驚人智慧”,並將其訓練設置應用於自己的模型。而Anthropic聯合創始人Jack Clark認為,DeepSeek“雇傭了一批高深莫測的奇才”。

#DeepSeek #深度探索 #R1 #V2 #人工智能 #大模型
平台新聞號
9 天 前
開發投入不超過600萬美元,中國 DeepSeek R1 登頂美國蘋果商店下載量榜首!R1在數學、代碼、自然語言推理等任務上的性能能夠比肩OpenAI o1模型正式版,並採用MIT許可協議,支持免費商用、任意修改和衍生開發等。

#DeepSeek #R1 #MIT #APPstore
WowBoy
9 天 前
來自中國、成立僅一年半,人工智能初創公司DeepSeek,使用英偉達H800 GPU,以短短兩個月,訓練出前沿開源大模型DeepSeek-V3,直接趕超美國AI巨頭OpenAI投入超過百倍的頂級模型GPT-4o。引發美國人工智能領域轟動,外媒爭相報道稱,「 中國初創企業Deep Seek威脅到美國在人工智能領域的主導地位 」。

#人工智能 #AI #科技 #DeepSeek #大模型 #創新
Richard Lee
11 天 前
訓練預算僅 550 萬美元(約港幣 4,290 萬)中國初創公司發表 DeepSeek V3,其技術實力迅速超越 Meta 最新的 Llama 4。

撕開了科技巨頭的遮羞布。

當Meta工程師們正在實驗室里用3930萬H100 GPU小時打磨Llama 3時——DeepSeek-R1僅以266.4萬H800 GPU小時的訓練量(相當於Meta預算的1/15),並在2025 年1月20日交出了6710億參數的超級模型。

#DeepSeek #meta
Richard Lee
11 天 前
《紐約時報》援引UC伯克利教授Alex Dimakis評價道,DeepSeek的技術路線揭示了一個殘酷事實——達到頂尖性能未必需要天文數字投入,“這對硅谷的燒錢競賽無異於釜底抽薪"。

#DeepSeek

未找到任何內容!

對不起,我們無法在我們的數據庫中找到與您的搜索查詢 {{search_query}} 相關的內容。請嘗試使用其他關鍵字重新搜索。