其實deepseek敢開源,我覺得他們不是真的毫無準備。他們能沒想到美國的ai企業會利用ds的算法,加快美國模型的進度,和強化ai的能力,最后會建立更高的護城河么?
大家想到的事,人家清北的人才能沒想到么。
現在已經有外網分析出來,他們是繞過了cuda語言,直接在更底層的PTX語言進行編譯,特化了他們用的h800顯卡。簡單的說就是,顯卡官方自帶的語言指令在作模型訓練的時候,是有些無效和浪費時間的,所以他們自己在更基礎的語言上,把這些浪費或者瞎運行的時間去掉了,這樣大幅度提高了h800顯卡本身在ai模型上的訓練效率和縮短了反饋時間。
所以實際上,ds某些算法上的縮短效率的操作,是針對特定顯卡的。(當然也有其他算法步驟確實普遍簡化了訓練時間)如果換一塊顯卡,未必就會在模型訓練時候在效率提升上會有那么大的差距。
這一方面是ds程序員在拿不到美國最新顯卡下的不得已而為之,而另一方面我懷疑這才是ds隱蔽的護城河。
就是說同樣的方法對你們投資幾百億美金,拿到最高級顯卡的公司,這招提升效率是毫無意義的,你不能扔掉花了幾十個億的最高級顯卡h200,去買運行速度很慢 效率更低的h800。所以你永遠沒法達到和ds在低等級顯卡訓練上競爭。
這就像是,ds用算盤找到了一種快速計算大位數乘法的秘訣,但是OpenAI因為有電腦,他直接按電腦就能得出計算結果,所以無論ds再怎么提高珠算能力,OpenAI也沒法學,因為openai不可能放棄電腦的快速計算,去學珠算。
但是我感覺,ds真正的殺招還沒出。
就是ds公布的模型是用h800做出來的,但實際上很可能ds團隊具有在h200,或者ascend 910c,或者amd顯卡上重新編譯和特化處理器加速的能力。
我覺得ds真正敢于開源搏殺的原因在這,你學我搞一樣的模型沒用,我有特化顯卡的能力,你沒有,所以你拿著一樣的顯卡,你搞不過我,拿比你弱的顯卡又能搞到和你一樣,你沒法學我。
其實這事對英偉達來說絕不是利好,ds一定不會反對英偉達和ds合作,甚至還會鼓勵英偉達造出適合ds模型計算的芯片和顯卡。
但是未來ds一定會把他的基礎編譯語言能力,賦能給華為的芯片和處理器。這樣就變成,你想超過ds,你就必須買華為的芯片,還要必須有超過ds強化芯片和處理器的編譯基礎語言的能力,才能追上ds的模型,不然你就越來越落后。
現階段ds一定會和英偉達合作,維持住ds創建出來的,新的,由ds布局的,ai開源的生態。讓AMD,英偉達都對ds伸出合作的友善之手。但是等到2,3年后,華為910c的下一代,如果能趕上h200的性能,那個時候,就是ds使出絕殺的時候。
到時候就是中國的芯片,中國的算力,中國的ai絕殺美國所有ai公司的時候。到時候你美國ai公司想超過中國,要不就讓英偉達發明出計算能力更強的芯片,要不就只能買華為的芯片。
而你買了華為的芯片,那英偉達的護城河就被打破了,但是就算你買了華為的最高端的芯片,你還是沒有特化華為芯片的能力,你還是比不過ds。
這樣華為ascend芯片,就和ds雙雙建立了一條護城河,ds先在全球ai領域開源,建立生態圈,讓全球所有企業都以他的基礎模型開發和應用,等隨后他的模型在華為芯片出來后升級,并且繼續開源,這樣就能確定中國芯片處理器好和ai最新模型的雙霸統治局面。
但是這個唯一的問題就是,臺積電最強的芯片是供給英偉達的,中芯國際離臺積電還有不小的差距,這樣英偉達始終就會領先華為一步,那ds就不得不憋著他的特化芯片和處理器的能力,先用著英偉達被制裁的低級顯卡,不過好在ds硬是找到了低級顯卡訓練大模型的方法,至少能和美國第一梯隊的科技巨頭在ai模型上打個平手,再依靠開源維持局面。
中國這邊還有一個辦法就是,想辦法加大中芯國際的產量,讓他瘋狂爆7nm和5nm芯片,再讓華為用產量把ai用的芯片堆上去。
說白了,還是ds手里的顯卡太少,手里如果有10倍于美國大企業的芯片,就算升騰910c每片是h200一半的算力,那也比美國優勢大得多。
現在就看華為在芯片上怎么權衡了,是優先爆產量,還是優先沖設計更高級的處理芯片。在他沒取得突破前,局面就只能這樣。等華為芯片一旦取得性能和產量上的突破,那英偉達和一眾美國ai公司的死期就到了,而美國的國運也就到頭了。