返回 首頁

我愛小說移動版

都市...首富從AI浪潮開始
關燈
護眼
字體:

第二百一十九章 回到石器時代

我的書架 | 投推薦票
上一章 目錄 下一章

2月13日,雖然是個週六,但也是大部分科技公司復工的第一天。

早上八點五十,林一舟來到公司,主管正站在門口發開工利是。

接過紅包,林一舟讓嘴角往上揚了揚,和主管說了聲“恭喜發財”,然後...

江松然回到工位時,窗外天色已近黃昏,玻璃幕牆映着遠處深圳灣的微光,像一整片浮動的碎銀。他沒開燈,手指無意識地摩挲着鍵盤邊沿——那是一塊被長期使用磨出溫潤弧度的金屬邊,和他三年前在新加坡調試第一臺自研訓練集羣時用的那臺MacBook Pro一模一樣。有些習慣,是刻進肌肉裏的。

飛書彈出一條新消息,是趙文淵發來的:【江博,腳手架搭好了,Profiler數據剛導出,你看看?】後面跟了個鏈接,還附了一張截圖:八卡環境下的端到端鏈路已跑通,模型加載耗時1.23秒,前向傳播2.47秒,反向傳播8.61秒……所有步驟均未報錯,內存佔用曲線平滑,通信延遲穩定在187微秒上下。最底下一行小字寫着:“KV-cache讀寫命中率91.3%,RMSNorm融合後誤差<0.0015。”

江松然點開鏈接,下載了完整的trace文件。他沒急着看數據,而是先打開終端,敲了一行命令:`cat /proc/cpuinfo | grep "model name" | head -n1`。屏幕上跳出一行熟悉的字符:“Intel(R) Xeon(R) Gold 6330 CPU @ 2.00GHz”。他笑了笑——這臺機器是源智科技採購的首批測試服務器之一,CPU型號和他當年在Meta實習時用的開發機幾乎一致。硬件可以換,但底層邏輯不會背叛人。

他雙擊打開viztracer生成的火焰圖,鼠標緩緩下拉。當視線停在“gradient_sync”那一層時,指尖一頓。火焰圖裏有一小段淺紅色的毛刺,持續時間僅43毫秒,卻比周圍深紅區塊高出近乎一倍。他放大、縮放、切片,最後定位到一段被標記爲“all-reduce fallback path”的調用棧。再往深一層,函數名赫然是`memcpy_async_host_to_device`。

江松然靠回椅背,閉眼三秒。睜開時,他直接撥通了趙文淵的電話:“趙總,那個all-reduce fallback路徑,是不是還沒切到硅明的NCCL兼容層?”

電話那頭靜了兩秒。“……對,我們還在用NVIDIA NCCL的patch版做適配,硅明那邊給的驅動包上週纔到,今天下午剛部署完,還沒來得及測。”

“現在就測。”江松然聲音不高,但每個字都像鋼珠落玉盤,“把剛纔那輪Profiler數據清掉,重新跑,這次用硅明原生的libnccl.so,參數加--enable-ib-verbs --disable-cuda-graph。”

“可我們連IB網卡驅動都還沒完全校驗過……”

“那就一邊跑一邊校驗。”江松然打斷他,“跑不通就記日誌,日誌裏標清是驅動層報錯還是用戶態崩潰,崩潰地址給我截全。另外,讓負責通信的李哲把硅明SDK文檔第37頁的ring topology配置表打印出來,我要看他手寫的筆記——不是PDF,是手寫。”

電話掛斷後,江松然起身,從工位抽屜底層取出一個牛皮紙信封。裏面是一疊泛黃的A4紙,邊緣捲曲,是他在新加坡國立大學帶學生做分佈式訓練課設時的手稿。其中一頁用紅筆圈出三個詞:拓撲感知、零拷貝、異步歸約。旁邊批註一行小字:“CUDA生態把程序員寵壞了,以爲顯存就是內存,忘了物理距離永遠存在。”

他把這頁紙夾進筆記本,又翻開最新一頁,寫下今天的日期,然後工整地列出四行:

1. 硅明L100的PCIe帶寬利用率峯值僅62%,遠低於標稱值→查DMA引擎調度策略

2. KV-cache命中率91.3%看似健康,但尾部延遲P99高達28ms→查片上緩存替換算法是否適配Transformer長序列

3. RMSNorm融合後誤差0.0015,在FP16精度下已逼近理論下限→此非bug,是硅明芯片FP16累加器的固有舍入特性

4. all-reduce fallback路徑觸發,本質是硅明NCCL未識別到RDMA網卡→非驅動問題,是其SDK中device enumeration邏輯漏判了Mellanox ConnectX-6的vendor ID

寫完,他合上本子,突然聽見門口傳來一陣低沉而極富節奏感的腳步聲。不是高跟鞋敲擊地磚的脆響,也不是運動鞋橡膠底摩擦地毯的沙沙聲,而是某種更沉實、更剋制的落地節奏——像軍靴靴跟包銅後踩在實木地板上的聲音。

門被推開一道縫,韓路一探進半個身子,手裏拎着兩個紙袋。一股熟悉的香氣飄了進來:蔥油餅酥脆的焦香混着現磨咖啡豆的堅果調性。

“江博士,知道你今天肯定顧不上喫飯。”他把袋子放在江松然桌上,沒等邀請便拉開對面椅子坐下,“我讓行政買了兩家店的——‘阿婆蔥油餅’的鮮肉餡,和‘藍山實驗室’的埃塞俄比亞耶加雪菲手衝。你先挑一個。”

江松然愣了一下,隨即指了指咖啡袋:“謝謝韓總,我選這個。”

韓路一笑着撕開包裝,倒出兩杯,一杯推過去,另一杯自己捧着,熱氣氤氳中他目光掃過江松然桌角那本攤開的筆記本——封面印着新加坡國立大學AI系統實驗室的燙金徽標。“你還在用這個本子?”

“嗯,寫了七年。”江松然喝了口咖啡,溫度剛好,“每換一家公司,我就撕掉舊的,留新的。但這本……是我在NUS帶第一個博士生時買的,他後來去了OpenAI,臨走前說,這本子裏記的不是代碼,是‘如何讓機器不騙人’。”

韓路一聞言,輕輕吹了吹咖啡表面:“所以你剛纔是不是已經看出all-reduce的問題在哪了?”

江松然沒否認,只問:“韓總怎麼知道我在看這個?”

“因爲趙文淵五分鐘後就會衝進來找你。”韓路一嘴角微揚,“而且他手裏會拿着一張打印紙,上面全是報錯日誌,第一頁抬頭寫着‘silicon_lumin_nccl_v1.2.0_fallback_fail.log’。”

話音未落,門外果然響起急促的敲門聲。趙文淵推門而入,額角沁着細汗,手裏果然攥着幾張A4紙:“江博!韓總!那個……硅明NCCL真跑起來了,但all-reduce還是fallback!不過這次報錯不一樣——”他快步上前,把紙攤在江松然面前,“你看第三行!它在找/lib/modules/5.15.0-91-generic/kernel/drivers/infiniband/hw/mthca/mthca.ko,可咱們裝的是ConnectX-6,驅動根本不在這個路徑!”

江松然拿起筆,在紙上空白處迅速畫了個簡圖:左側是硅明SDK的device enumeration函數,右側是Linux內核模塊樹,中間一條虛線標註“vendor_id匹配邏輯”。他在虛線上打了個叉,又在右側模塊路徑旁寫下:“mlx5_core.ko → 應該匹配這裏”。

“不是驅動沒裝,是SDK寫死了Mellanox老款HCA的枚舉方式。”他把紙轉過來推給韓路一,“韓總,硅明這版SDK,應該是照着他們早期客戶用的舊網卡寫的。要改,得動他們的build-in rule engine。”

韓路一盯着那張草圖看了三秒,忽然抬眼:“你有把握改?”

“有。”江松然點頭,“規則引擎是用Rust寫的,語法我熟。但需要他們開放源碼權限,或者至少給一份帶符號的debug版本。”

韓路一沒猶豫:“我明天飛鵬城,親自跟硅明CTO談。你把需要修改的模塊列表、預期改動行數、以及驗證方案列個清單,今晚十點前發我。”

江松然應下,卻沒立刻動筆。他望着韓路一,忽然問:“韓總,您爲什麼敢信我?”

辦公室裏一時寂靜。窗外最後一縷夕照斜斜切過兩人之間,照亮空氣中懸浮的微塵。韓路一沒看江松然,目光落在自己左手腕內側——那裏有一道極淡的舊疤,像條蜷縮的銀魚。

“因爲我爸病危那天,醫生說我媽籤的手術同意書裏,有十七處醫學術語寫錯了。”他聲音很輕,“但主刀醫生還是進了手術室。後來我問他爲什麼,他說——‘你媽抄錯了,但她的理解是對的。她知道哪裏疼,知道要切哪塊,這就夠了。’”

他頓了頓,終於轉向江松然:“你今天拆解訓練鏈路,不是在教我們怎麼做,是在告訴我們——**機器不會撒謊,但人會誤讀它的語言。而你,聽得懂它真正的語法。**”

江松然喉結動了一下,沒說話。他低頭,重新翻開筆記本,在方纔那四行分析下面,鄭重添上第五行:

5. 韓路一不是在賭技術,是在賭一種認知範式——當所有人還在爭論“用哪家卡”,他已經默認“卡只是載體”,真正要重建的,是中國人對算力底層邏輯的命名權。

他寫完,合上本子。窗外夜色已濃,深圳灣對岸的燈火次第亮起,連成一片流動的星河。手機震了一下,是飛書通知:【Al Infra交流羣】有人@他。

點開,是羣暱稱叫“LLaMA煉丹師”的用戶發了一張截圖:某國際頂會論文預印本首頁,標題赫然寫着《Sili-Lumin L100: A 600-TFLOPS AI Accelerator with Open-Source Software Stack》。文末致謝欄第二行小字:“We thank Jiang Songran for insightful feedback on memory coherency design.”

江松然怔住。他從未見過這篇論文,更沒提供過任何反饋。

他立刻翻出微信,找到備註爲“硅明-張工”的聯繫人,發去一句:“張工,你們這篇論文……我怎麼不知道?”

對方秒回:“江博?哈哈,這是上個月你幫我們debug內存一致性問題時隨口提的建議!我們按你說的重寫了cache coherence state machine,效果太好了!主編硬塞進來讓你掛名致謝——放心,不佔作者位,純感謝!”

江松然盯着屏幕,忽然笑出聲。笑聲不大,卻震得他自己耳膜微麻。

原來他早已在不知不覺中,把名字刻進了國產算力的地基裏。

這時,韓路一站起身,拿起外套:“走吧,江博士。我請你喫頓飯。不是慶功宴——”他拉開門,走廊燈光灑進來,勾勒出他挺直的肩線,“是開工宴。從今晚起,源智科技的訓練棧,正式進入‘硅明紀元’。”

江松然跟着起身,經過打印機時,順手抽走一張剛吐出來的紙——是趙文淵打印的all-reduce報錯日誌。他在空白處用筆劃掉第三行錯誤路徑,重新寫下正確模塊名,字跡鋒利如刀。

走出電梯時,他手機又震了一下。是飛書系統通知:

【源智科技期權授予協議V2.1已簽署完成】

【您的2%期權已生效,行權價:¥15.8/股】

【附:CEO特別備註——“致江博士:這不僅是股份,更是第一塊國產訓練棧的主板編號。編號001。”】

江松然站在大廈旋轉門前,玻璃映出他身後整棟樓的燈火。每一扇亮着的窗,都像一顆正在編譯的芯片核心。

他忽然想起醫院初見韓路一那天,對方遞來的那杯咖啡也是這個溫度——不燙手,不涼舌,恰如其分地支撐人清醒地走向深淵,再親手把它鑄造成階梯。

夜風拂過深圳灣,帶着鹹澀與鐵鏽的氣息。遠處海面上,一艘貨輪正緩緩駛離鹽田港,船身燈火蜿蜒,如同一條遊向深海的發光水母。

江松然終於邁步向前,踏入光裏。

錯誤舉報 | 加入書籤
上一章 目錄 下一章
本站推薦
1986:從廠二代開始
我的學習羣裏全是真大佬
重生08,我被確診爲醫學泰鬥
夢迴1997,我成了網文鼻祖
華娛:功夫之王
無上血脈
鐵血強國
商途
半條小命
大道主
朝天闕
少年醫聖