這兩周硬件股可謂風起雲湧,先是美光財報大超預期拉起整個半導體板塊,其後蘋果加價、Meta租出數據中心舊有和多餘的算力等,重挫硬件股。我認為當中有一些是噪音,有一些則會帶來較長期的影響,真正值得留意的是3條暗線:政策、數據、Token。
美國政府上周一度以國家安全及出口管制為由,要求外籍人士(例如要驗身份證)才能使用相關模型,後來限制才解除。這不只是Anthropic一間公司的問題,而是整個閉源大模型商業模式的「黑天鵝」。
閉源模型所以能收取高價,本質上是因為比公開模型領先一截;我們之前在觀察的是Anthropic不願意其模型被用在美國國防上,會不會是特朗普政府的報復手段,但目前看來,OpenAI最新的GPT-5.6也一視同仁,先緩慢開放,再逐步放開。但中美模型的差距本就在愈收愈窄,時至今日,美國模型已只領先中國大概3至6個月左右,因此如果美國最前沿的模型無法被快速放出,加上中國模型更具成本優勢,我會將此視之為更中長期的影響。
那就引伸出下一個問題:究竟是有雞先還是有蛋先。中國的模型追得這麼緊湊,是否必須靠蒸餾美國模型(所以要先有蛋)才行呢?如果是的話,那這3至6個月的模型差距將持續存在,就不會影響長期的護城河。
我不認為中國模型是完全靠蒸餾和合成數據,事實上,很多人在不同平台上發布了他們自己蒸餾的模型,例如用Fable 5的回覆來訓練Qwen模型,但這樣做完一圈後,往往表現比訓練前的Qwen模型更差。
朋友Patton分享了一個觀點,合成數據的主要功用是在模型初訓練的時候拿來作cold-start或一部分的mid-training,到模型「成形」後,可以想像他「已經過了青春期,有自己的思維方式」後,再盲目用填鴨式教育(術語上是off-policy synthetic data)硬塞給模型往往只會適得其反。因而,中國模型蠻確定是有蒸餾的成份,中美模型「互抄功課」已不是新鮮事,問題是如何「抄」。
「中轉站」擁最值錢資源
最近在X上看到了一篇很有趣的文章,講述了中國模型進化的另一面。文章分享了AI中轉站生意是如何帶起中國模型的。由於美國的模型禁令,作為一個中國人,要用Anthropic的Claude簡直如同諜戰,只要你在對話間不小心透露了一絲一毫的「中國人」線索,就會立即被Anthropic ban掉,香港亦不例外。
很多中國開發者無法直接使用Claude,便經灰色中轉站(第三方)繞個彎地用Claude。於是,這個第三方的中轉站既可看到用戶問的問題、用戶的代碼架構、Claude的回覆,以及用戶的追問,這些珍貴的真實用戶數據、實際的工作流,對於大模型而言才是最值錢的資源,再然後中轉站便可以將這些數據賣給國內模型廠商,國外模型的中轉站就這樣反哺國內大模型,帶起數據飛輪。
我個人傾向認為對國外封鎖最前沿的模型,對於即將上市的OpenAI及Anthropic而言,並非上策。
市場另一個「鬼故事」是作為其中一間雲大廠,正如我們之前所想的一樣,Meta仿效SpaceX(或xAI),將多餘、舊有的算力租借出去。隨着大模型的「御三家」:OpenAI、Anthropic、Google 慢慢跑出(個人覺得應該是「御兩家」,因Google大模型與前兩家有較大差距),市場擔心像SpaceX及Meta這類的落後玩家租借自己算力後,會令整個市場對於算力的需求減少,因而,過去幾天「殺硬件」力度相當大。
這是一個「鬼故事」,對於Meta這是純粹的利好,因為多餘的低端算力有另一個增長引擎,但還可多看幾個方面:第一,Meta最近加注算力,與Crusoe簽訂了新的1.6GW合同;第二,Meta仍繼續大舉買入Neocloud的算力;第三,幾周前Google指出Gemini模型無法處理來自Meta的龐大需求。我認為Meta將低端、舊有的晶片租出作推理(inferencing)較合理,且各位在最近用AI時,應該亦可以顯著地感覺到各模型的額度,尤其是Anthropic開始慢慢減少,很快就用完。Anthropic最近兩個月增長的ARR有很大部分都是靠來自SpaceX的算力,因而,與其針對「AI落後玩家」的算力,我認為更應該聚焦在「頭部玩家在有更多算力下能否真的產出更多」。
續看好光通訊、存儲、CPU
Anthropic的Economic Index指出,高薪職業、複雜產出,如建App、做簡報、寫程式,消耗的Token顯著更高,換言之,更多Token可以做到更高的產出。
另一個我相信被大大低估了的新聞是OpenAI與Broadcom做出的新晶片Jalapeño,據聞是純用OpenAI Codex設計的,當AI開始連最前沿的科技,如晶片設計都開始能做時,意味着AI開始走上最高產值的行業。
我認為Claude Code與Codex,直到今天這一刻依然被市場大大低估,OpenAI最新數據指出,目前用家中使用Codex的只佔0.7%,但他們使用了總輸出Token約16.5%,這中間的增量空間可謂巨大。最新Codex出的新功能「Record and Replay」,讓用戶錄屏自己的行為,然後AI來幫忙做自動化,我認為將改變市場的看法,屆時市場將更price-in token = revenue,我們繼續看好光通訊、存儲、CPU、Semicap長期的發展。
No comments:
Post a Comment