每日經濟新聞 2023-03-10 15:22:02
◎下周,百度的“文心一言”將與GPT-4正面對決。
每經記者 文巧 每經編輯 高涵
圖片來源:視覺中國
當地時間3月9日,據德國科技媒體報道,在一場名為“AI in Focus - Digital Kickoff”的活動上,微軟德國公司的首席技術官安德烈亞斯•布勞恩(Andreas Braun)透露了一個重磅消息——GPT-4將于下周正式推出,并提到了一個關鍵細節,GPT-4將是多模態的。
語言模型的多模態意味著什么?基本上,這個模型可以管理不同語言數據的輸入和輸出,也能夠同時輸出文本、圖像甚至視頻,而目前的ChatGPT版本只能生成文本。正如布勞恩所說,“GPT-4將是一個多模態模型,它會提供完全不同的可能性——例如視頻。”
據外媒分析,如果將這種可能性(多模態)轉移到ChatGPT上,用戶可以用西班牙語提出請求,但生成的文本是英文的。顯然,這一功能對翻譯工具也有很大幫助。
布勞恩將大型語言模型稱為一個“游戲規則改變者”,這項技術已經發展到基本上“適用于所有語言”。借助多模態,微軟(和OpenAI)將使模型變得更全面。
值得注意的是,百度的類ChatGPT產品發布也進入倒計時,預計將于3月16日(下周四)推出“文心一言”。這意味著,下周,“文心一言”將與GPT-4正面對決。
《每日經濟新聞》記者注意到,此前,有傳聞稱GPT-4模型擁有多達100萬億的參數。不過,在此前接受外媒采訪時,OpenAI首席執行官薩姆•阿特曼(Sam Altman)曾進行辟謠,稱這個傳言為“徹頭徹尾的胡說八道”。
“GPT-4有一座‘謠言工廠’,這很荒謬。我不知道這一切是從哪里來的,”阿特曼說道, “人們期待我們已經擁有真正的通用人工智能,但事實是我們還并沒有。”
在此前被問及GPT-4的發布時間時,阿特曼并未回應具體的時間,但他表示,“當我們有信心可以安全和負責任地做到這一點時,它會在某個時候出現。”隨著GPT-4即將于下周公布的消息曝出,這意味著,OpenAI已經對此有了足夠多的信心。
在9日的活動上,布勞恩并未透露更多GPT-4的細節,而目前OpenAI和微軟也仍未公布有關GPT-4的細節信息。根據已有信息,外媒對GPT-4的模型參數和性能等方面做了預測。
尺寸
根據此前阿特曼的說法,GPT-4不會比GPT-3大很多。因此模型大小將不會是GPT-4的一個顯著特征,預計GPT-4大約將有1750億~2800億個參數,或與Deepmind的Gopher模型類似。值得注意的是,參數大并不代表性能更高。阿特曼此前曾表示,公司正專注于讓更小的模型表現得更好。
最優性
與GPT-3相比,GPT-4需要更多的算力。該模型在參數化和規模理論上,將實施更新的優化性見解。
稀疏性(指模型具有非常大的容量,但只有模型用于給定任務、樣本或標記的某些部分被激活。這樣,能夠顯著增加模型的容量和能力,而不必增加計算量。)
GPT-4 將是一個密集模型,這意味著所有參數都將用于處理任何給定的輸入,這一點上遵循GPT-2和GPT-3設定的趨勢。
對齊(指引導AI系統的行為,使其符合設計者的利益和預期目標。)
GPT-4 將比GPT-3更接近用戶的利益,它將從InstructGPT中學到的東西集合在一起,InstructGPT根據用戶的反饋數據進行訓練。
封面圖片來源:視覺中國
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP