亚洲永久免费/亚洲大片在线观看/91综合网/国产精品长腿丝袜第一页

<meter id="6676w"></meter>

每日經濟新聞

每經網首頁丨
宏觀丨
金融丨
公司丨
視頻丨
券商丨
IPO丨
基金丨
汽車丨
房產丨
新文化丨
未來商業丨
文創通丨
城市丨
每經商學院

要聞

每經網首頁 > 要聞 > 正文

復旦大學教授張奇：認清大語言模型能力邊界非常關鍵

每日經濟新聞 2024-09-25 12:44:21

每經記者朱成祥每經編輯梁梟

9月25日上午，“解碼未來：全球數智趨勢”專題論壇在上海浦東成功舉辦。論壇由工業和信息化部工業文化發展中心、上海市經濟和信息化委員會、上海市浦東新區人民政府主辦。

本次專題論壇是工業文明國際論壇的分論壇之一。主論壇以“工業文明·中國力量”為主題，設一個主論壇和三個分論壇，來自多個國家的政府代表和專家、企業家，聚焦工業文明變遷、人工智能和在線新經濟、新能源和智能網聯汽車、先進材料、生物醫藥、產城人文、工業博物館等熱點議題展開討論。

在“解碼未來：全球數智趨勢”專題論壇上，復旦大學計算機科學技術學院教授張奇以“大語言模型能力邊界與發展思考”為題發表了主題演講。張奇認為，圍繞長上下文建模、多任務學習、跨語言遷移性、文本生產能力這些核心能力，與場景做結合，將有巨大的價值。對于未來的大模型，清晰認知它的能力邊界非常重要。如果對能力邊界有共識，對于未來投資的力度和方向就有很好的把握。但是可能還需要一定的時間，或許一年、兩年的時間才能完成確認（認知能力邊界）。

張奇發表主旨演講圖片來源：主辦方供圖

張奇提到，2023年，大家認為大模型無所不能，所有的地方都可以使用，可以寫code（代碼），可以做醫療，能夠做很多東西。但是干了一年后，大家發現，大模型落地總是差那么一口氣。

他舉例，去問大模型一句詩的下一句是什么，它可以做得很好，但是如果讓它回答一句詩的前面一句是什么，或者一個成語的中間一個字是什么，結果會變得非常差。這也就讓我們思考，為什么大模型會出現這些情況，它能做什么，不能做什么。

對于微調階段，張奇認為，這和前一階段的訓練數據非常相關，想讓它有什么樣的能力，就得準備什么樣的訓練數據，而且是非常精心地準備，這和自然語言處理的邏輯非常不同。過去可以大量加訓練數據，現在完全不是。

關于大模型能力邊界，張奇認為，目前可以確認的大模型的能力是上下文建模、多任務學習、跨語言遷移性、文本生成能力。

文本生產能力方面，張奇稱，在ChatGPT之前，自然語言處理研究者是不敢做自然語言生成的，因為難度非常大。模型大到現在這種程度之后，自然語言生成就可以做得非常好了。

張奇表示，可確認的就是這四個能力。“但是推理怎么樣，我覺得OpenAI還是做了非常值得研究的過程，去年我們也做了很多過程型的推理，但是它的泛化能力怎么樣，以及未來是什么，我覺得還需要非常仔細地研究。”張奇說道。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

張奇大模型

上一篇文章

破解算力產業供需對接難題成都這場專場座談會現場發布供需清單

返回每經網首頁

下一篇文章

銀行間回購定盤利率全線下跌

相關文章

熱文精選

點擊排行

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

相關信息
關于我們
版權聲明

關注我們
辟謠專區

加入我們
招聘專頁

Copyright ? 2024 每日經濟新聞報社版權所有，未經許可不得轉載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網絡社會征信網

兒童色情信息舉報專區

成都市互聯網不良與違法信息舉報中心

四川省互聯網舉報中心

中國互聯網舉報中心

每日經濟新聞互聯網不良與違法信息舉報中心

互聯網新聞信息服務許可證：51120190017 網站備案號：蜀ICP備19004508號-3 川公網安備 51019002002026號

新聞職業道德監督熱線：400 889 0008 郵箱：zbb@nbd.com.cn