李彥宏內部講話曝光：首次談及文心大模型為什么不開源

每日經濟新聞 2024-04-11 21:05:58

◎文心大模型為什么不開源？李彥宏這樣說。

每經記者可楊每經編輯張海妮

4月11日晚間，《每日經濟新聞》記者獲悉，在近日的一次內部講話中，李彥宏對大模型開源與閉源的路線選擇，以及AI創業者應該專注模型還是應用等業界焦點話題，發表了看法。

在此次內部講話中，李彥宏提到，閉源模型在能力上會持續地領先，而不是一時地領先；模型開源也不是一個眾人拾柴火焰高的情況。這跟傳統的軟件開源——比如Linux、安卓等很不一樣。

李彥宏還表示，閉源，是有真正的商業模式的，是能夠賺到錢的，能夠賺到錢才能聚集算力、聚集人才。閉源在成本上反而是有優勢的，只要是同等能力，閉源模型的推理成本一定是更低的，響應速度一定是更快的。

此外，李彥宏提到，無論中美，當前最強的基礎模型都是閉源的。通過基礎模型降維做出來的模型也是更好的，這使得閉源在成本、效率上更有優勢。對于AI創業者來說，核心競爭力本就不應該是模型本身，這太耗資源了，而且需要長時間的堅持才能跑出來。

李彥宏認為，既做模型又做應用的“雙輪驅動”，對創業公司不是好模式。創業公司的精力和資源都很有限，更應該專注。既做模型又做應用，勢必會分散精力。

圖片來源：視覺中國-VCG111486664989

以下為李彥宏內部講話實錄的部分原文：

一、為什么不開源

已經有足夠多的開源大模型

一年前文心剛剛發布的時候，我們內部是有過非常激烈的討論的，最后當然大家也知道這個結果，我們的決定是不開源。為什么不開源？當時的判斷是，市場上一定會有開源的模型，而且是不止一家會開源。在這種情況下，多百度一家開源不多，少百度一家開源也不少。

我們今天看主流的開源模型，像Llama、Mistral，其實都是有相當影響力的，國內的智源、百川、阿里的通義也都是開源的，這個市場上不缺我們這一家開源的模型。我們要開源還得自己去維護一套開源的版本，這是不劃算的。

閉源模型能力會持續領先

更重要的是，在我們的認知里，閉源模型在能力上會持續地領先，而不是一時地領先。為什么會有這個判斷？因為我們覺得模型開源的意義其實不是很大，這些開源模型都是在外頭零零散散小規模地去做各種各樣的驗證應用，它沒有經過大算力的驗證。

而且模型開源也不是一個眾人拾柴火焰高的情況。這跟傳統的軟件開源——比如Linux、安卓等很不一樣，由于是模型帶來的開源，我們也不知道參數為什么變成了那個樣子，這種情況下很難實現眾人拾柴火焰高。雖然Llama也鼓勵大家去貢獻各種各樣的數據、代碼，但是實際上大家明白最主要的開發者就是Meta這些人，它并不是一個真正由大家一起來協同開發的產品。

閉源才有真正的商業模式，才能聚集人才和算力

反觀閉源，是有真正的商業模式的，是能夠賺到錢的，能夠賺到錢才能聚集算力、聚集人才。其實也很簡單，大家比較一下，比如硅谷有一個優秀的人才，他有OpenAI的offer，有Meta的offer，有Llama的offer，他會去哪兒？這是非常顯而易見的選擇。

閉源在成本上也有優勢

大家以為開源是免費的，在成本上有優勢，實際上我們認為也不是，閉源在成本上反而是有優勢的。只要是同等能力，閉源模型的推理成本一定是更低的，響應速度一定是更快的。反過來，同等參數的情況下，閉源模型的能力也是更強的。今天不管是在中國也好、在美國也好，最強的基礎模型都是閉源的，而各種各樣的小模型、最好的小模型，都是通過大模型蒸餾來的。通過大模型降維做出來的模型就是更好的，這樣也導致閉源在成本上、在效率上更有優勢。