華爾街見聞 2024-07-16 11:41:51
12日,Microsoft發布了一個新的大型語言模型,計劃為Excel、谷歌Sheets等電子表格應用程序開發全新的AI大語言模型--SpreadsheetLLM。
Microsoft在論文指出,SpreadsheetLLM作為一款全新的AI模型,將廣泛使用于理解并處理復雜的電子表格數據。
SpreadsheetLLM具有改變電子表格數據管理和分析的潛力,為更智能和高效的用戶交互鋪平了道路。
這或許會讓會計師和數據分析師們對他們的未來工作前景感到擔憂。網友們在社交平臺X上調侃,認為“凱倫的工作很快就會被人工智能取代”。
“凱倫可能很快就會失業”
研究人員指出,當前的電子表格應用程序功能豐富,在布局和格式方面為用戶提供了大量選擇,這使得傳統的AI大語言模型難以在電子表格處理方面發揮作用。而SpreadsheetLLM就是專門為電子表格應用而設計的AI模型。
微軟還開發了SheetCompressor(壓縮電子表格)工具,以幫助SpreadsheetLLM更好地理解和處理電子表格數據。
研究人員稱,SpreadsheetLLM的潛在應用非常廣泛,從自動執行日常數據分析任務,到提供基于電子表格數據的智能見解和建議。例如,SpreadsheetLLM可用于自動生成財務報告、識別數據中的異?;蜈厔?、為客戶提供個性化的產品或服務推薦等。
因此,SpreadsheetLLM有可能徹底改變企業處理數據的方式。
一位用戶聲稱:“正如我們所知,能夠編寫SQL的LLM將扼殺整個數據工程行業。”
另一位寫道,“SaaS陷入了深深的麻煩。”
“這對金融界來說將產生巨大影響”
賓夕法尼亞大學沃頓商學院副教授伊桑·莫利克(Ethan Mollick)在推特上寫道:“這再次表明LLM很快就能處理結構化和非結構化電子表格數據。這將解鎖許多用例(預測、財務、估值等),并且擁有電子表格真實來源往往會減少幻覺。”
SpreadsheetLLM如何工作?
SpreadsheetLLM通過將電子表格數據編碼為大型語言模型(LLM)可以理解的格式,從而使LLM能夠對電子表格數據進行推理、回答有關數據的問題,甚至根據自然語言提示生成新的電子表格。
SpreadsheetLLM的核心是“SheetCompressor”框架,該框架可以有效地壓縮和編碼電子表格數據,使其更易于LLM處理。SheetCompressor由三個模塊組成:
▲基于結構錨點的壓縮:在整個電子表格中放置“結構錨點”,以幫助LLM理解數據結構。
▲逆索引翻譯:將電子表格轉換為更緊湊的格式,并消除冗余數據。
▲數據格式感知聚合:根據數字格式和數據類型對相鄰單元格進行分組。
SHEETCOMPRESSOR框架的插圖(圖片:Microsoft)
Microsoft稱,SpreadsheetLLM顯著提高了電子表格檢測任務的性能,在GPT4的上下文學習設置中比普通方法高出25.6%,使用詞元(token)的成本降低了96%,并能提供更好的處理結果。
目前,Microsoft還沒有公布何時向公眾發布SpreadsheetLLM的消息。該論文指出,該模型仍有一些限制,如對于復雜或結構化程度高的數據,其理解能力仍然有限;SheetCompressor目前還不能壓縮包含自然語言的單元格等等。
(作者 張雅琦)
封面圖片來源:視覺中國-VCG41N1472123004
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP