OpenAI 推出 GPT-4 大型語言模型 諸多測試中表現(xiàn)比人類都好
GPT-4 可以更準確地解決你的難題,多模態(tài)的 GPT-4 還可以生成、編輯具有創(chuàng)意性或技術性的文章,在高級推理方面的表現(xiàn)超過其前輩(當前公開版?ChatGPT 基于 GPT-3.5)。當然,正如大家所猜測的那樣,微軟 New?Bing 的聊天功能確實基于?GPT-4。
此外,該公司正在與合作伙伴 Be My Eyes 一起測試 GPT-4 的圖像輸入能力(注:Be My Eyes 是一款即將推出的智能手機 App,可以識別場景并對其進行描述,類似于大家常見的 AI 識圖的加強版)。
除了介紹網(wǎng)站,OpenAI 還提供了描述 GPT-4 功能的技術性論文,以及詳細描述其局限性的系統(tǒng)模型 Card。

OpenAI 計劃通過 ChatGPT 及其商業(yè) API 為用戶提供 GPT-4 的文本功能支持,但目前還需要等待。IT之家這里需要提醒一下,GPT4 目前僅 ChatGPT plus 賬號可用,可選 GPT4 模式進行對話,每 4 小時限制發(fā)送 100 條消息。
收費方面,大約 750 個單詞的提示收取約 3 美分的費用,約 750 個單詞的響應則收取 6 美分(就是問和答的區(qū)別)。

OpenAI 聲稱,ChatGPT-4 比迭代前的 GPT-3.5“更大”,這意味著它接受了更多的數(shù)據(jù)訓練,模型文件中有更多的權重(參數(shù)),這也使得它的運行成本更高。
該公司聲稱,該模型“比以往任何時候都更具創(chuàng)造性和協(xié)作性”,“可以更準確地解決難題”。它可以解析文本和圖像輸入,盡管它只能通過文本進行響應。
就任務而言,GPT-4 的表現(xiàn)比前輩更好,它可以遵循自然語言的復雜指令并生成技術或創(chuàng)意內容,而且它可以還更深入地做到這一點:它支持生成和處理多達 32768 個標記(約 25000 個文本單詞),從而實現(xiàn)比前輩更長的內容創(chuàng)建或文本分析。
OpenAI 承認,該公司使用了微軟云計算平臺 Azure 來訓練其模型,微軟已經(jīng)向 OpenAI 投資了數(shù)十億美元。OpenAI 以競爭為由,沒有公布具體的模型大小或用于訓練它的硬件等細節(jié),這些細節(jié)可以用來重建模型。
官方表示,GPT-4?錯誤答案更少,而且也會減少偏離話題的可能,也盡可能不會再談論禁忌話題,甚至在許多標準化測試中比人類表現(xiàn)得都要更好一些。
例如,GPT-4 在模擬律師考試的成績在考生中排名前 10% 左右,在 SAT 閱讀考試中排名前 7% 左右,在 SAT 數(shù)學考試中排名前 11% 左右。相比之下,GPT-3.5 在律師考試中的得分一般都是倒數(shù) 10% 左右。當然,它們考個研究生還是沒問題的。
