中國積極擴大理工類從全世界招募科研人才

積極培養!中國鼓勵國外理工類大學赴陸辦學 專家:陸科研人才質與量即將超越西方總和
鉅亨網編譯陳韋廷  2025-02-04 13:50

cover image of news article
陸科研人才質與量即將超越西方總和(圖:Shutterstock)

今年初,中國政府印發《教育強國建設規劃綱要(2024-2035 年)》,其中提出優化高等教育佈局,並鼓勵國外高水準理工類大學附中國合作辦學,並支援高校改善學生宿舍等辦學條件,有序擴大優質本科教育招生規模,擴大研究生培養規模,穩步提高博士研究生佔比,大力發展專業學位研究生教育。

最新研究報告指出,除了本土人才培養優勢漸漸擴大外,在吸引海外科研人才方面,中國也開始縮小與美國的差距,中美以外的全球人才越來越多選擇到中國繼續開展研究。

根據《全球高層次科技人才態勢報告》,全球頂尖科學家流向已經發生根本變化。從 2020 年到 2024 年美國高層次科技人才數量從 3 萬 6599 人下滑到 3 萬 1781 人,中國則從 1 萬 8805 人增至 3 萬 2511 人,兩國頂尖科學家在全球佔比已經逆轉,中國增速極為驚人,僅靠本土培養不可能實現 5 年翻倍,更是因為吸引全球人才。

日本「光催化之父」藤島昭 2021 年帶著整個團隊來到中國,因中國有能力為他提供良好的科研環境,讓他在光催化領域繼續開展研究。基礎科研非常燒錢,包括美國在內全球各國都在削減經費投入,只有中國還在繼續大幅增加投入,2024 年研發經費逾 3.6 兆人民幣,研發經費投入強度達到 2.6%,尤其基礎研究經費支出年增 10.5%。

中國理工類人才培養數量遠高於中國人口佔比,碩士佔比大概在全球一半左右,理工類博士也在三分之一左右,而且中國的理工科碩博士教育水準遠高於發展中國家水準,說中國高等教育不足,也是跟發達國家比,而且對比的也是美國、德國、日本這類上游發達國家。

隨著中國科研、產業進步,中國理工科人才培養數量和水準仍在不斷上升。 從人才角度,幾乎可以說中國培養出來的佔了世界一半。 AI 領域就是典型例子,近幾年,全球 AI 頂尖人才,中國培養出來的超過 40%,所以才說中美 AI 競爭,本質是中國人與在美華人之間的競爭。

論本土人才培養,美國明顯弱於中國,恐怕要所有發達國家加在一起,才能跟中國比較。

最新遺產稅怎麼算?傳承必知重點有哪些?
掌握全球財經資訊點我下載APP

文章標籤
科研人才
理工類大學
AI
中國高教
紅保單大勢再起!保險投資必讀攻略
相關行情
台股首頁
我要存股
人民幣/美元
0.137893
-0.07%
鉅亨號貼文
看更多
北風窗
北風窗
投資人不等IPO,開始搞BD了
北風窗
北風窗
中微公司經住了時間的考驗
北風窗
北風窗
他把鏟子賣給了DeepSeek
北風窗
北風窗
恆大,突發!
北風窗
北風窗
剛剛!暴漲超37%!
北風窗
北風窗
大爆發!盤中漲超30%
北風窗
北風窗
首次突破兆美元!
北風窗
北風窗
7000億!長江儲存出貨294層快閃記憶體晶片,中國記憶體晶片全面反攻!
北風窗
北風窗
寧德時代:2024年獲利最高530億元,每10股分紅12.3元
北風窗
北風窗
阿里加速搶佔日韓市場
right-arrow

上一篇

【大國博弈】商務部:中國已將美對華徵稅措施訴至世貿組織
下一篇

《寶島股市》台股反彈收升0.44%,報22793.96點

推薦閱讀
施羅德投信:台股多頭暫緩 格局不變 出口站穩高位 企業財報亮眼 雖有挑戰 支撐力雄厚
川普關稅政策再起波瀾 市場憂聯準會降息步伐或生變
制裁8年無用!大疆無人機市佔仍稱霸全球 美媒:創辦人實在強得「可怕」
自我訓練或抄襲?專家:DeepSeek使用的技術在AI界廣為人知
「黑天鵝」作者:輝達崩盤只是開始 未來拋售可能是DeepSeek衝擊的2至3倍
新加坡失寵?報導稱中國富豪紛紛回流香港
Recommended by
arrow_forward_ios閱讀文章

Play

00:00
00:17
Mute
Play

















熱門時事
看更多




































PC版
鉅亨APP
鉅亨號
聯絡我們
意見箱
© 2000-2025 Anue鉅亨網 All rights reserved.
Scroll to Top

DeepSeek的r1-zero和r1

https://hao.cnyes.com/post/133475

【DeepSeek】LeCun痛批矽谷傲慢病!圈內爆火長文:DeepSeek R1-Zero比R1更重要,成AGI破局關鍵
2025/02/02

奧特曼罕見地承認了自己犯下的「歷史錯誤」,LeCun發文痛批矽谷一大常見病——錯位優越感。 DeepSeek的終極意義在那?這篇圈內熱轉的分析指出,比起R1,R1-Zero具有更重要的研究價值,因為它打破了終極的人類輸入瓶頸!
DeepSeek再度創造歷史。

居然能逼得OpenAI CEO奧特曼承認:「我們在開源/開放權重AI模型方面,一直站在了歷史的錯誤一邊。」

LeCun也發文指出,矽谷圈子的常見疾病,就是一種錯置的優越感。

高級階段的症狀,是認為小圈子就能壟斷好的想法。而晚期症狀就是,假設來自他人的創新都是靠作弊。

DeepSeek的最大意義在那裡?
ARC Prize聯合創始人Mike Knoop發出長文中總結道——R1-Zero打破了最終的人類輸入瓶頸——專家CoT標註!其中一個例子,就是監督微調(SFT)。

從R1-Zero到AGI,一切都與效率有關。

另一個值得注意的觀點是:相較於R1,R1-Zero具有更重要的研究價值。

這是因為,R1-Zero完全依賴強化學習(RL),而不使用人類專家標註的監督微調(SFT)。

這就表明,在某些領域,SFT並非實現精準清晰CoT的必要條件,完全有可能讓AI透過純粹的RL方法實現廣泛推理能力。

以下為Mike Knoop的完整分析。

從此,推理計算需求激增
上周,DeepSeek發佈了他們新的R1-Zero和R1「推理」系統,在ARC-AGI-1基準測試上的表現可與OpenAI的o1系統相媲美。

R1-Zero、R1和o1(低算力模式)都取得了15-20%的得分,而GPT-4o僅為5%——而這已是多年純LLM scaling的巔峰成果。

根據本周美國市場的反應,大眾也開始理解了純LLM scaling的限制。

然而,大多數人仍沒有意識到推理計算需求即將激增的問題。

2024年12月,OpenAI發佈了一個新的突破性系統o3,經過驗證,該系統在低算力模式下得分76%,高算力模式下得分88%。

o3系統首次展示了電腦在面對全新、未知問題時進行適應的通用能力。

儘管o3在ARC-AGI-1基準測試中取得了突破性的成績,但這一科技大事件卻在主串流媒體中幾乎未被報導,也未引起廣泛關注。

這是AI和電腦科學領域的一個極其重要的時刻,這些系統值得深入研究。

然而,由於o1和o3是閉源的,我們只能依靠推測進行分析。

幸運的是,借助ARC-AGI-1,以及現在(幾乎)開放原始碼的R1-Zero和R1,我們能夠進一步加深對這一領域的理解。

這裡的「幾乎」指的是,DeepSeek並未公佈從零開始復現其模型權重的方法。

特別值得注意的是,相較於R1,R1-Zero具有更重要的研究價值。

R1-Zero比R1更值得分析:它消除了人為瓶頸

在對o1和o3的分析中,ARC Prize團隊對這些推理系統的工作原理進行了推測。

它們的關鍵思路如下:

為特定問題領域產生思維鏈(CoT)。
使用人工專家(「監督微調」SFT)和自動化機器(「強化學習」RL)的組合對中間的CoT步驟進行標註。
利用(2)中標註的資料訓練基礎模型。
在測試時,模型會基於這個推理過程進行迭代推理。
下圖回顧了各模型用於迭代採樣的技術,及其在ARC-AGI-1評分的相關情況。

隨著DeepSeek發表的新研究,ARC Prize團隊就可以更好地驗證自己的推測。

一個關鍵的發現是,LLM推理系統在適應新穎性(以及提高可靠性)方面的提升,主要沿著以下三個維度展開:

為CoT過程模型的訓練加入人工標註,即SFT(監督微調)。
使用CoT搜尋而非線性推理(即每個步驟並行進行CoT推理)。
進行整體CoT取樣(即並行推理整個軌跡)。
第(1)點受到人工資料產生的限制,因此決定了那些領域的推理系統能從中受益最大。

例如,在o1系統上,MMLU中的專業法律類目得分遠低於數學和邏輯類目,令人頗感意外。

第(2)和(3)點的主要瓶頸在於計算效率。

o1和o3都在ARC-AGI-1基準測試上表現出對推理計算量的對數式改進,即它們在測試時使用越多的計算資源,基準精準率就越高。

同時,不同的計算方式會影響這條曲線在x軸上的位置。

ARC Prize團隊認為,DeepSeek最有趣的做法是單獨發佈了R1-Zero。 R1-Zero不使用SFT(即不依賴人工標註),完全依賴強化學習(RL)。

R1-Zero和R1在ARC-AGI-1上的得分高度一致,分別為14%和15%。

此外,DeepSeek自己發佈的基準測試結果也顯示R1-Zero和R1的表現相近,例如在MATH AIME 2024上的得分分別為71%和76%(相比之下,基礎模型DeepSeek V3的得分僅為約40%)。

在論文中,R1-Zero的作者指出:「DeepSeek-R1-Zero在可讀性較差和語言混雜等方面存在挑戰」,這一點也在網路上得到了印證。

然而,在ARC Prize團隊的測試中,他們幾乎沒有發現R1-Zero在ARC-AGI-1上表現出不連貫性,而這項測試任務與該系統透過強化學習訓練的數學和程式領域相似。

綜合這些發現,ARC Prize團隊得出了以下結論:

在具有強可驗證性的領域,SFT(即人工專家標註)並非實現精準且清晰的CoT(思考鏈)推理的必要條件。
R1-Zero的訓練過程能夠透過RL最佳化,在token空間內自發性地建構內部的特定領域語言(DSL,Domain-Specific Language)。
SFT在提升CoT推理的跨領域泛化能力方面是必要的。
這點符合直覺,因為語言本質上也是一種推理DSL。相同的“字”可以在一個領域中學習,並在另一個領域中應用,就像程式一樣。

而純RL方法目前尚未能夠發現一個廣泛共享的詞彙體系,這可能會成為未來研究的重要方向。

最終,R1-Zero展示了一種潛在的擴展路徑——即使在訓練資料收集階段,也完全消除了人工瓶頸。

可以肯定的是,DeepSeek 的目標是挑戰OpenAI的o3系統。

接下來的關鍵觀察點在於:SFT是否仍然是CoT搜尋和取樣的必要條件,或者是否可以建立一個類似「R2-Zero」的系統,在相同的對數式推理計算擴展曲線上繼續提升精準率。

根據R1-Zero的實驗結果,團隊認為,在這個假設的擴展版本中,SFT並不是超越ARC-AGI-1所需的條件。

用更多資金,換取AI的可靠性
從經濟角度來看,AI領域正在發生兩大重要變化:

投入更多資金,以獲得更高的精準性和可靠性。
訓練成本正在轉移到推理成本。
這兩點都將大大推動推理計算的需求,同時也不會抑制對更強運算資源的需求,反而會進一步增加運算需求。

AI 推理系統的價值,遠不止於提高基準測試中的精準度。

目前阻礙AI更廣泛自動化應用(即推理需求)的首要問題,就是可靠性。

ARC Prize團隊曾與數百位試圖在業務中部署AI智能體的Zapier客戶交流過,他們的反饋高度一致:「我還不信任它們,因為它們的工作表現不夠穩定。」

以前,ARC Prize曾提出,朝著ARC-AGI方向的進展將提升AI可靠性。

LLM智能體的主要挑戰在於,它們需要強而有力的本地領域控制才能穩定運作。

而更強的泛化能力,要求AI能夠適應全新的、未見過的情況。如今,已有證據顯示這一觀點是正確的。

因此,Anthropic、OpenAI、Apple等多家公司紛紛推出AI智能體也不足為奇。

由於可靠性需求,智能體將推動短期內的推理計算需求成長。

此外,開發者可以選擇投入更多運算資源,以提高使用者對系統的信任度。

然而,更高的可靠性並不代表100%的精準性——但它能讓錯誤更加穩定、可預測。

這反而是可接受的,因為當準確率較低時,使用者和開發者可以透過提示詞更穩定地引導AI行為。

過去被認為電腦無法解決的問題,如今都可以用金錢衡量其解決成本。隨著AI計算效率的提升,這些成本也將逐漸下降。

推理即訓練:AI資料獲取範式或將永久轉變
另一個正在發生的重要變化,是用於LLM預訓練的資料來源。

過去,大多數訓練資料要麼是購買的,要麼是從網路爬取的,要麼是由現有的LLM合成生成(例如蒸餾或資料增強)。

但推理系統提供了一種全新的選擇──產生「真實」資料,而非傳統意義上的「合成」資料。

AI產業通常將「合成資料」視為品質較低的資料,這些資料通常是透過LLM循環產生的,只是為了增加訓練資料的整體規模,但其收益會逐漸遞減。

如今,借助推理系統和驗證器,我們可以創造全新的、有效的資料來進行訓練。這可以透過兩種方式實現:

離線產生-開發者支付費用來建立資料。
推理時產生-終端使用者支付費用來建立資料。
這是一種引人注目的經濟模式轉變,可能會導致AI系統開發者之間出現「贏家通吃」的局面。

擁有最多付費使用者的AI公司將擁有龐大的資料壟斷優勢,因為這些使用者在無形中資助了新高品質資料的建立,而這些資料反過來又進一步提升模型能力,使其更受使用者青睞……由此形成一個自增強的良性循環。

如果我們能夠突破人類專家CoT標註的瓶頸,並建立一個極高效的搜尋/合成+驗證系統來自動產生新資料,那麼可以預見,未來將會有大量計算資源投入這些推理系統。

因為這些系統的訓練效果將直接與資金投入和資料輸入量掛鉤,也就是說,只要投入資金和原始資料,模型就會變得更強。

最終,這種AI訓練模式將徹底取代基於人類生成資料的預訓練方法。

結論:DeepSeek推動全世界科學發展
隨著推理需求的成長變得更加明確,市場將繼續經歷調整。

AI 系統的效率提升不僅會推動更多的應用,這不僅符合傑文斯悖論,更重要的是,更高的運算效率解鎖了全新的訓練範式。

隨著R1的開源和可復現性,越來越多的個人和團隊將探索CoT和搜尋技術的極限。

這將有助於我們更快地釐清當前AI研究的前沿在那裡,並推動一波技術創新浪潮,從而加速通往AGI的處理程序。

已經有幾位研究者告訴ARC Prize團隊,他們計畫在2025年ARC獎中使用R1風格的系統,這讓人非常期待看到最終的結果。

R1的開源,對全世界來說都是好事。 DeepSeek推動了科學的前沿發展,並為AI 研究帶來了新的突破。

參考資料:

https://arcprize.org/blog/r1-zero-r1-results-analysis (新智元)

想說些甚麼?
大叔啊,你之前才說什麼資料不重要,deepseek沒必要偷個人資料,怎麼這篇又說贏者全拿資料優勢呢?
7小時
您也可能喜歡這些文章
川普關稅政策再起波瀾 市場憂聯準會降息步伐或生變
金蛇年投資人的下一步? 野村:迎接2025新局,聚焦「這國家」投資底氣強
【DeepSeek】馬斯克,DeepSeek頭號黑粉
【DeepSeek】登頂140國榜首,免費開放原始碼的真相究竟是什麼?
【DeepSeek】AI ,突傳重磅!達利歐最新警告
利空突襲!美股市場全線跳水!
Recommended by

官方號
好康
客服
鉅亨網
© Copyright 2000-2022 Anue鉅亨網 All rights reserved.

德國經濟大衰退,真是悽慘!


近300萬人失業大軍 德陷入二戰後最長經濟衰退
2025/02/03 17:04  


吳孟峰/核稿編輯

〔財經頻道/綜合報導〕德國經濟持續下滑,聯邦就業局 (BA) 的官方數據顯示,2025年1月德國失業人數接近300萬人。研究人員認為,德國已陷入第二次世界大戰以來最長的經濟衰退。

德國持續的經濟衰退,給工業帶來嚴重打擊,關鍵產業出現大規模失業。德國經濟困境目前已延續至連續第二年萎縮,加劇許多人對這個曾經強大的工業強國正失去動力的擔憂。

請繼續往下閱讀…


聯邦統計局1月15日已證實,2024年經濟將萎縮0.2%,符合經濟學家的悲觀預測。根據統計局1月31日發布報告,失業人數較去年12月激增18萬6000人,達到299萬3000人。

與2024年1月同期相比,這一數字增加18萬7000,表明歐洲最大經濟體的危機正在加深。

更廣泛的所謂就業不足指標,包括參加勞動力市場計劃和短期喪失工作能力的就業不足人數,僅在1月份就增加6000人,達到371萬4000人,比一年前增加10萬7000人。職位空缺也正在迅速消失,就業成長動能越來越弱。

一手掌握經濟脈動 點我訂閱自由財經Youtube頻道

不用抽 不用搶 現在用APP看新聞 保證天天中獎  點我下載APP  按我看活動辦法


相關新聞
被習近平害慘!中國人20年來悲觀度暴增7倍
收入僅供自己開銷 近8成中國年輕人不買房、不結婚
日常消費神卡就是這家! 天天最高10%回饋
聯準會一口氣降息2碼 歐股收高
中國被取代了!「這國」上位成德國商品第4大出口國
美國取代中國 成德國上半年最大貿易夥伴
中國房市、製造業持續萎縮 上半年工人維權抗議757起
歐元區通膨意外上升 令歐央行進一步降息頭痛
德Q3經濟再陷萎縮 擬提高銀行準備金防企業破產
智庫:德國2024經濟恐萎縮0.5%


今日熱門新聞
焦點股》台達電:客戶墨國產線慘了 股價重挫9%
以牙還牙!安大略省2/4起「無限期」全面下架美國酒類
川普欲對台製晶片徵關稅 美專家:美科技業恐加速外移
焦點股》緯創:身陷AI重災區 上演百元保衛戰
焦點股》微星:逃過AI風暴中心 翻紅大漲
台股狂瀉千點摜破半年線 法人:落下刀子不要接
川普關稅、DeepSeek兩大利空!歐美期指接棒重挫逾2%
網友回應
自由時報
自由時報版權所有不得轉載 © 2025 The Liberty Times. All Rights Reserved.

美追AI晶片白手套 1張圖曝DeepSeek成立後輝達在星營收暴增逾7倍

2025/02/02

陳麗珠/核稿編輯

〔財經頻道/綜合報導〕中國新創公司DeepSeek被爆料擁有5萬顆被美國禁運的輝達晶片,白宮及聯邦調查局已啟動調查DeepSeek是否透過新加坡等第三方買家,違規取得輝達晶片。科技媒體也PO出一張圖,顯示自DeepSeek成立後,輝達在新加坡的銷售額激增 740%。

中國新創公司DeepSeek聲稱其開發的AI模型成本不到600萬美元,引發熱議,並一度造成股市崩跌。OpenAI 已指控中國DeepSeek未經授權盜用其 AI 模型進行開發。業界則認為,DeepSeek 採用了大量輝達H100 AI晶片來訓練模型。

請繼續往下閱讀…

研究機構SemiAnalysis也發布報告指出,該公司至今在硬體的支出,超過5億美元,並指出,中國對沖基金幻方量化在2023年5月成立DeepSeek推動AI技術研發,在此之前,幻方量化於2021年,亦即美國出口管制生效前,投資購買1萬顆輝達A100 GPU。這項研究表明DeepSeek標榜AI大模型開發成本低廉,難取信於市場。

目前,美國的焦點是追查DeepSeek如何取得已被禁運的輝達先進晶片,白宮及聯邦調查局官員(FBI)正在調查DeepSeek是否透過新加坡的第三方買家,充當白手套購買輝達先進晶片,以規避美國禁令。

輝達發言人表示,新加坡企業購買輝達晶片並不代表會轉往中國,許多客戶在新加坡都有業務實體,並利用這些實體製造輸往美國和西方的產品。

新加坡貿易和工業部1日發表聲明稱,輝達已說明沒有理由相信DeepSeek從該國取得任何出口管制產品,星國也期望輝達等美國公司遵守美國的出口管制規定和星國法律,星國海關和執法機構將持續與美國相關部門合作。同時強調星國一向堅持法治,堅決打擊藐視相關規定的個人和企業。

科技媒體執行長在領英PO文指出,自 DeepSeek 成立以來,輝達在新加坡的銷售額大幅成長。(圖取自Subhash KM 領英帳號)
科技媒體執行長在領英PO文指出,自 DeepSeek 成立以來,輝達在新加坡的銷售額大幅成長。(圖取自Subhash KM 領英帳號)

儘管新加坡否認DeepSeek從該國取得任何出口管制產品,科技媒體WhiteNoise執行長Subhash KM在領英PO文指出,外界正在討論DeepSeek 是否透過新加坡非法取得輝達晶片,若以數據觀察,自 DeepSeek 成立以來,輝達在新加坡的銷售額大幅成長 740%。

這項數據難以論斷DeepSeek繞道新加坡取得輝達先進晶片,不過,為了補破網,川普政府正在考慮進一步收緊對中國的 AI 晶片出口管制,甚至可能將輝達專為中國市場開發的 H20 晶片納入禁令範圍。

輝達執行長黃仁勳也於美東時間1月31日在白宮與川普會面,討論中國DeepSeek 崛起,以及美國政府可能進一步加強對 AI 晶片出口限制。

end

你可能有興趣
日本哪裡外國遊客最多?NHK用大數據框出驚訝地區
日本外籍勞工達230萬人創新高 這3國占最多
DeepSeek梁文峰放假消息做空輝達海撈?華爾街大老:若屬實是金融犯罪
加國反擊川普新關稅有妙方 ! 專家揭「1利器」 可踩美國痛點
揚言關閉美軍基地遭反嗆斷金援遷至台邦交國 宏都拉斯龜縮了
投信蛇年首日大買近百億瘋搶5金融!這檔最狂 敲逾9300張
Recommended by
今日熱門新聞
焦點股》台達電:客戶墨國產線慘了 股價重挫9%
以牙還牙!安大略省2/4起「無限期」全面下架美國酒類
川普欲對台製晶片徵關稅 美專家:美科技業恐加速外移
焦點股》緯創:身陷AI重災區 上演百元保衛戰
焦點股》微星:逃過AI風暴中心 翻紅大漲
台股狂瀉千點摜破半年線 法人:落下刀子不要接
川普關稅、DeepSeek兩大利空!歐美期指接棒重挫逾2%
網友回應
自由時報
自由時報版權所有不得轉載 © 2025 The Liberty Times. All Rights Reserved.

中國出口晶片超越手機

根據中國海關總署的數據,2024年中國集成電路(晶片)出口額達到1594.9億美元,創歷史新高,年增17.4%,並連續14個月保持增長。值得注意的是,晶片已超越手機,成為中國出口額最高的單一商品。

分析指出,這一增長主要得益於終端電子產品需求的提升,以及人工智慧(AI)應用的推動,使得此前高企的庫存得以消化,從而刺激了出口。然而,中國出口的主要仍是中低端晶片,高端晶片仍依賴進口。

展望未來,全球半導體市場預計將繼續增長,但增速可能放緩。中國的晶片出口可能會受到關稅和「去中國化」等因素的影響。此外,市場關注美國可能在近期進一步加徵關稅,這可能促使中國在新政策出台前加緊進口半導體產品。

總體而言,儘管面臨國際制裁和技術封鎖,中國的晶片產業在2024年表現出強勁的增長態勢。但在高端晶片領域,仍需加大自主研發和生產能力,以減少對進口的依賴。

p.s.美國禁止出售中國晶片,反而促使中國晶片大量製造。

【DeepSeek】一夕之間,微軟、輝達、亞馬遜全部接入DeepSeek!吳恩達:中國AI正在崛起

美股艾大叔

2025/01/31

微軟、輝達、亞馬遜等美國雲端運算平台擁抱DeepSeek R1。吳恩達、英特爾前CEO誇讚DeepSeek創新能力。

1月最後一天,來自DeepSeek的熱度絲毫不減。

遠在大洋彼岸的美國,不僅從業者感受到了前所未有的壓力,那些平時對AI毫不關心的人,也感受到了來自中國AI的震撼——

Anthropic CEO呼籲美國加強晶片管制力道;OpenAI尋求矽谷史上最大400億美元單筆融資。

網友們則借助寬鬆的開源許可,製作出了用DeepSeek-R1取代OpenAI Operator的教學——不用200美元訂閱,完全免費!

「俗話」說得好:「打不過就加入」。

一開始便對DeepSeek讚賞有加的輝達,剛剛宣佈:「DeepSeek-R1正式登陸NVIDIA NIM」。據介紹,在單一NVIDIA HGX H200系統上,完整版DeepSeek-R1 671B的處理速度可達3,872 Token/秒。

同在今天,亞馬遜也在Amazon Bedrock和SageMaker AI中,上線了DeepSeek-R1模型。

曾經衝出來和OpenAI一起高調質疑DeepSeek「偷竊」資料的微軟,甚至在前一天就把DeepSeek-R1搶先部署在了自家的雲端服務Azure上。

除了科技大廠,AI新創們也沒有放過這麼好的機會。

Windsurf編輯器同時整合了DeepSeek-R1和V3模型,並且第一次在程式設計智能體中,實作了R1的工具呼叫。

Cerebras不僅實現了比GPU快57倍的推理速度,而且還報告稱,自己部署的70B模型在精準率上要比GPT-4o和o1-mini更高。

中國AI正在崛起

在吳恩達看來,本周圍繞DeepSeek的熱議,讓許多人清楚地看到了幾個一直存在的重要趨勢:

  1. 美國在GenAI領域的領先地位正被中國迎頭趕上,AI供應鏈格局將被重塑
  2. 開放權重模型正在推動基礎模型層商品化,為應用程式開發者帶來新機會
  3. 擴大規模並非通往AI進步的唯一途徑。儘管算力備受追捧,但演算法創新正在快速降低訓練成本

中國在GenAI領域正在趕上美國

當ChatGPT於2022年11月推出時,美國在GenAI領域明顯領先中國。

由於觀念的轉變十分緩慢,所以吳恩達直到最近,都還能聽到不少關於中國仍然落後的論調。

但實際上,雙方的差距已經在過去兩年中迅速縮小。

隨著Qwen(吳恩達團隊已經用了幾個月)、Kimi、InternVL和DeepSeek等模型的推出,中國在文字模型上的差距正在縮小,而在視訊生成等領域,中國甚至已經展現出了一些領先優勢。

如今,DeepSeek-R1不僅開源了模型權重,而且還分享了一份包含許多細節的技術報告。

相較之下,一些美國公司卻透過渲染人類滅絕等假想的AI危險,推動制定法規來阻止開放原始碼的發展。

不可否認的是,開源/開放權重模型都是AI供應鏈的關鍵部分——很多公司都在使用。

對此,吳恩達表示:如果美國繼續妨礙開源,AI供應鏈的這一環節就將由中國主導。

開放權重模型正在使基礎模型層普及化

一直以來,LLM的Token價格都在迅速下降,開放權重模型不僅加速了這一趨勢,也為開發者提供了更多選擇。

OpenAI的輸出價格為60美元/百萬Token;而DeepSeek R1隻要2.19美元。這種近30倍的差異讓許多人注意到了價格下降的趨勢。

訓練基礎模型並提供API服務充滿困難,許多AI公司至今仍在尋找收回模型訓練成本的途徑。

紅杉資本的文章“AI’s $600B Question”很好地闡述了這個挑戰。

相比之下,在基礎模型之上進行應用開發,則有著絕佳的商機。

現在,已經有公司投入了數十億美元訓練了一些模型,而你只需支付少量費用就能訪問。然後,拿去開發客服聊天機器人、郵件摘要工具、AI醫師、法律檔案助理等諸多應用程式。

擴大規模並非AI進步的唯一途徑

圍繞著透過擴大模型規模來推動進步的熱議有很多,就連吳恩達也是早期的支持者之一。

許多公司為了數十億美元的融資, 製造「噱頭」:

只要有更多資金,他們就能(1)擴大規模並(2)可預測地推動改進。

因此,人們開始過度關注規模的scaling,而忽略了其他方式所取得的進步。

受到美國AI晶片禁令的影響,DeepSeek團隊必須在性能相對較低的H800 GPU上跑模型,而這也推動了他們在最佳化方面的大量創新。最終,模型訓練成本(不包括研究成本)不到600萬美元。

這是否真能減少計算需求仍有待觀察。有時,商品的單價變得更低,反而會導致該商品的總支出增加。

吳恩達認為:「從長遠來看,對智能和算力的需求是幾乎沒有上限的,所以即使智能變得更便宜,人類依然會使用更多智能。」

在X上,我們可以看到許多DeepSeek進度的不同解讀。就像「羅夏墨跡測驗」一樣,可以讓許多人將自己的理解投射其中。

雖然DeepSeek-R1的地緣政治影響仍有待明確,但它對AI應用的開發者來說確實是個好消息。

吳恩達的團隊已經在腦力激盪一些新的想法,而這些想法之所以成為可能,只是因為我們可以輕鬆存取一個開放的高階推理模型。

現在仍然是一個創造的好時機!

DeepSeek帶來的三個啟示

DeepSeek的成功,甚至「炸出」了晶片、運算產業的老兵——英特爾前CEO Pat Gelsinger。

身為業界非常資深的工程師,Gelsinger認為,現在這些針對DeepSeek的反應,忽略了我們在過去五十年來電腦發展歷程中學到的三個重要教訓。

第一:計算遵循「氣體定律」

計算會像氣體一樣, 填滿由可用資源(資本、電力、散熱限制等)定義的可用空間。

正如在CMOS、個人電腦、多核心處理器、虛擬化、行動裝置等眾多領域所看到的那樣,以極低的價格廣泛提供運算資源,將推動市場的爆炸性擴張,而不是收縮。

未來AI將無所不在,而今天,要實現這一潛力的成本仍然高得離譜。

第二:工程的本質就是因應約束

很明顯,DeepSeek團隊面臨諸多約束,但他們找到了極具創意的方法,並以低10-50倍的成本,交付了世界一流的解決方案。

美國的禁令限制了可用資源,因此中國的工程師不得不發揮創造力,而他們也確實做到了——價值數百億美元的硬體、最新的晶片和數十億美元的訓練預算,都不再是必需品。

多年前,Gelsinger曾採訪過最著名的電腦科學家之一Donald Knuth。他詳細描述了當資源極度受限、進度要求最緊迫時,該如何做出最好的工作。

Gelsinger表示,這個洞見是他工程管理生涯中最重要的啟示之一。

第三:開放終將勝利

過去幾年,看到正變得越來越封閉的基礎模型研究,實在令人失望。

在這一點上,Gelsinger更認同馬斯克而不是奧特曼的觀點——我們真的希望,不,是需要AI研究的開放性得到提升。

我們需要知道訓練資料集是什麼,研究演算法並對其正確性、倫理和影響進行深入思考。 Linux、GCC、USB、WiFi等眾多例子,已經讓這一點無比清晰。

在法律、光譜、工程和採用方面的戰鬥中,開放並不容易,並且始終受到市場力量的挑戰。但只要給適當的機會,「開放」每次都會勝出。

AI對人類未來的重要性不言而喻,因此,絕對不能讓一個封閉的生態系統在這個領域成為唯一的主宰。

DeepSeek是一個令人難以置信的工程壯舉——它將推動AI實現更廣泛發採用,並將幫助重塑產業對開放創新的看法。

正是這樣一個來自中國的高度受限的團隊,讓我們所有人重新想起了這些電腦歷史的基本教訓。

參考資料:

https://www.linkedin.com/posts/patgelsinger_wisdom-learning-the-lessons-i-thought-i-activity-7289659541477113856-o1Qr/ (新智元)


#DeepSeek#吳恩達#中國AI72人3 則留言讚留言分享

pwr max

好厲害 加油

昨天 21:38讚回覆

SEAN PAN

鉅亨聯合報系統?!中國好棒棒?!怎麼不直接去當中共人.

昨天 16:53讚回覆

Modocho

👍

前天 05:51讚回覆

您也可能喜歡這些文章

耐心機會主義:引領當前市場的投資策略巴菲特對華爾街的警告:2025年投資者需要做的三件事【野村投信台股操盤人筆記】龍年擺尾,蛇年資金歸隊挑戰新高【DeepSeek】DeepSeek的深度推理能力,太適合高效完成文獻檢索了!【DeepSeek】劉潤:DeepSeek這把火,為何燒疼了矽谷?【DeepSeek】“幫DeepSeek獲得晶片”?新加坡回應

Recommended by

PV排行榜日榜週榜月榜年榜

1【DeepSeek】o3-mini物理推理粉碎DeepSeek R1,OpenAI王者歸來!全網最全實測來襲2【DeepSeek】LeCun痛批矽谷傲慢病!圈內爆火長文:DeepSeek R1-Zero比R1更重要,成AGI破局關鍵3川普會見黃仁勳!馬斯克也突然加入!4【關稅戰】川普對加、墨、中突施關稅!九張表揭示貿易戰對四國有何影響5【DeepSeek】火爆華爾街的萬字報告:比特幣和輝達暴跌背後6【DeepSeek】一夜之間,微軟、輝達、亞馬遜全部接上DeepSeek!7金蛇年即將開紅盤,潛力股大公開?8輝達市值一周縮水超5000億美元引發產業連鎖反應9【DeepSeek】比DeepSeek更猛的,是DeepSeek的創始人台股頻道新上線!快速切換技術線圖與績效掌握即時資訊

官方號好康客服鉅亨網

© Copyright 2000-2022 Anue鉅亨網 All rights reserved.

德語媒體:DeepSeek震撼美國 激勵歐洲

#歐洲人終於講真話了!
媒體看中國
2025年2月1日 週六 下午9:36

DeepSeek橫空出世震撼全球
(德國之聲中文網)旗下擁有多家地區性大報的《德國編輯部網絡》以“圍繞DeepSeek的恐慌就像圍繞人工智能的狂熱一樣瘋狂”為題,刊發評論指出,一家中國小公司研發的AI模型居然能讓一家老牌企業股份蒸發數千億美元,足見人工智能領域如今瘋癲到了何種程度。

“這不僅僅事關股票市場的盈虧,也事關一項能夠改變我們生活的科技,事關誰能掌控這種科技。這就是一場地緣政治權力鬥爭。”

“通過股市投機致富的企業家梁文峰正在慶祝其在AI研發領域的重大突破,這絕非巧合。擁有領先的人工智能是保持美國經濟、軍事、政治實力的新關鍵所在。拜登希望通過出口管制來保持美國對中國的領先優勢,特朗普則宣布設立星際之門人工智能基礎設施合資公司,目的同樣是保持對中國的領先優勢。但如今,一家剛剛成立兩年的中國初創企業顯然跟上了美國人的腳步,而且其成本要低得多。這可真是來自中國的問候。”

廣告

“目前還很難判斷DeepSeek到底能做些什麼,但是特朗普的‘警鐘’說法卻是相當正確的,歐洲人也應該聽到這個警鐘。現在,這個純粹的中國AI模型正在全球千千萬萬台手機、電腦上安裝運行,而且由於其開源特性,還會成為無數其他應用程序的根基。”

“至於美國科技企業是否會利益受損,可能對於其他國家而言並不重要。但是,一個專制政府控制的AI模型是否會成為無處不在的日常工具,這個問題則絕非無關緊要。”

廣告

杜塞爾多夫出版的德國《經濟周刊》以“DeepSeek表明,太多金錢會導致懶惰、失去創新能力”為題,刊發評論指出,中國人如今的成就很大程度上來自於美國的制裁。

“這家初創企業的成就證明了一點:資源稀缺能夠激發創造力。而且,小團隊往往更加靈活高效,因為他們不得不專注於最重要的事項。技術資源有限則迫使他們尋找務實的、而非顯而易見的方案。此外,資金有限也意味著圍繞金錢分配的鬥爭會減少。”

廣告

“況且,美國的制裁也可能起到很強的激勵作用。中國人會覺得,現在必須要拿出實力讓人看看。這種激勵效應絕不容小覷,處於逆境之中的人願意付出更多的努力,工作時間更長、更賣力。”

“DeepSeek的程序員們沒有頂級的H100芯片,只能使用減配版的H800芯片,但他們用創造力彌補了這一劣勢。H800芯片上總共有132個流處理器核心,工程師們對其中20個進行重新配置,使它們專門管理跨芯片通信。”

廣告

作者接著指出,特朗普在就職典禮次日就高調宣布耗資5000億美元的“星際之門”AI基礎設施合資公司項目,這只會讓人懶惰,因為AI從業者會挖空心思去搞到這筆錢,而不是把精力更多花費在改進產品上。而且,DeepSeek也並非來自於資金充沛的阿裡巴巴等中國科技巨頭,而是一家名不見經傳的小公司。

“這意味著什麼?科技制裁是一條錯誤的道路。歐美必須和中國展開一場(公平的)科技競賽。此外,政府不應當繼續實施嚴厲的經濟制裁、縱容那些財大氣粗的壟斷企業,而是應該首先確保市場的正常運轉。遺憾的是,我們不得不依靠中國來得出這個結論。”

廣告

慕尼黑出版的《南德意志報》以“中國的DeepSeek領先美國,這樣蠻好”為題,刊發評論指出,來自中國的AI模型打破了美國的壟斷,而且還證明了一件事:成本可以比以前低得多。

“這表明,世界不必繼續依賴美國的AI科技。不論是OpenAI還是谷歌,他們的人工智能程序都是加密的,但是DeepSeek的關鍵部分卻是開源的,每個人都能拿來並根據自己的需求進行改造。這意味著人人都能獲得廉價甚至免費的高性能AI,比如可以用來當作私人或者工作助理。這將是一場AI革命,受益的將不再是少數幾個億萬富翁。而且,下一代的此類AI模型不一定仍舊來自中國。”

廣告

“聽起來有點像充滿偏見的陳詞濫調:美國人依靠的是大量金錢以及超級計算機的力量,所謂大即是美。中國人則打造一款基於美國研發成果、卻更加節省的模式,並以此來對抗美國。DeepSeek已經找到了讓人工智能更加高效的方式,能夠節省資金和電力。當然,它也有其局限性:根據對比測試,最好的AI模型依然來自於OpenAI以及谷歌,DeepSeek的邏輯任務能力相對有限。而且,作為一家中國企業,DeepSeek也受到專制政權的支配。”

“中國已經在撼動美國的AI超級大國地位。OpenAI以及谷歌今後將更難從程序員等AI重度用戶處收取費用。美國企業以及投資者此前為AI統治戰略押注了重金,DeepSeek則讓這些投資陷入了風險之中。”

廣告

“然而,美國的優勢並沒有消失。今後較長時期內,中國人都將無法獲取英偉達的重要芯片,因為華盛頓對其實行出口管制。隨著AI熱潮的持續,芯片依舊會是緊俏商品。”

“不論如何,中國人告訴全世界,美國企業的壟斷是可以在形成之前就被打破的。美國人曾經有著可以將AI領域重要對手排擠出局的迷夢,現在卻突然從迷夢中驚醒。如今,人工智能已經成為了地緣政治,最終,這將取決於誰能更好地將AI整合到軍事之中。”

廣告

“迄今為止,歐洲只是旁觀者。但現在,歐洲人必須盡快動手改造出符合自己需求的更高效、更廉價AI模型。中國人已經證明了:在人工智能領域,美國並非衡量一切的標准。”

瑞士《新蘇黎世報》以“中國AI可以為歐洲帶來一項關鍵優勢”為題,刊發評論指出,開源的中國DeepSeek以更低成本實現了與OpenAI的付費AI模型相媲美的性能,這證明人工智能競賽中,海量資金以及龐大算力並不一定是決定性因素。這也將激勵歐洲人同樣用相對更弱的算力來實現AI領域的趕超。

廣告

“Deepseek為歐洲科研人員和歐洲企業在AI方面取得真正進步提供了新的機遇,同時也證明美國並不是人工智能競賽中無可爭議的領先者。這意味著歐洲在人工智能競賽中再次有機會重回領先。現在是抓住這個機會的時候了。”

“用戶需要每個月支付200美元才能無限制使用OpenAI的聊天機器人,但DeepSeek的AI模型卻是免費使用的,而且開源。這意味著誰都可以下載、查看、修改源代碼。對於歐洲企業而言,這是一個好消息。DeepSeek不僅僅比美國競爭對手便宜,還偏偏在數據安全方面更具吸引力:只要擁有足夠的自有算力,企業可以下載DeepSeek源代碼並部署在防火牆保護的企業內網中運行。這意味著企業能夠將AI嵌合到內部生產流程中,而不必冒著將內部數據暴露給外部公司的風險。OpenAI等公司的產品則不可能具備這種特性。”

“DeepSeek的模型對於研究人員而言也極具價值。他們既可以直接使用它,也可以在其基礎上改造開發出創新衍生品。通過使用自己的數據進一步訓練AI模型,研究人員可以讓DeepSeek專門用於某些特定任務。這需要大量專業知識,但是卻不需要太多的算力。這恰恰就是歐洲以及瑞士能夠發揮優勢的地方。”

“另一個因素可能更加重要:憑借DeepSeek,中國研發人員證明,哪怕在資金不足、算力不足的情況下,也能打造出優秀的AI模型。根據DeepSeek團隊描述其AI模型的科研論文,他們使用的芯片比美國競爭對手少得多也差得多,而成本相應地也只是美國競爭對手的一小部分。中國團隊還公開了如何實現這一目標的詳細秘訣。”

“這也為歐洲研發人員憑借同樣少的算力打造自己的頂級AI模型開辟了道路。歐洲人再也沒有借口去顧影自憐了,因為他們擁有AI大潮前沿所需的最重要資源:聰明且受過良好教育的大腦。政府以及科研機構現在必須思考如何才能最好地利用這一機會。得益於DeepSeek,人工智能競賽的結果現在再一次完全未知。”

摘編自其他媒體的內容,不代表德國之聲的立場或觀點。

延展閱讀 – 長平觀察:DeepSeek會成為地球獨裁者嗎?
©2025年德國之聲版權聲明:本文所有內容受到著作權法保護,如無德國之聲特別授權,不得擅自使用。任何不當行為都將導致追償,並受到刑事追究。

作者: 媒體看中國

你已獲得奇摩值
了解詳情
Yahoo奇摩會員只要閱讀文章就可以累積奇摩值、兌換各種商品唷!

立即登入領取

檢視留言14
服務條款/隱私權保護政策隱私權儀表板關於我們的廣告

使用 WordPress.com 設計專業網站
立即開始使用