老司机67194精品久久,亚洲美女牲交高清淅视频

你好，歡迎來到川北在線

騰訊微博

新浪微博

川北在線 > 資訊中心 > 科技資訊 >

OpenAI發(fā)布GPT-4.1，性能暴漲、100萬上下文

時間：2025-04-15 21:09 來源：ITBEAR 責任編輯：毛青青

　　原標題：OpenAI發(fā)布GPT-4.1，性能暴漲、100萬上下文

　　今天凌晨1點，OpenAI進行了技術直播發(fā)布了最新模型——GPT-4.1。

　　除了GPT-4.1之外，還有GPT 4.1-Mini和GPT 4.1-Nano兩款模型，在多模態(tài)處理、代碼能力、指令遵循、成本方面實現(xiàn)大幅度提升。特別是支持100萬token上下文，這對于金融分析、小說寫作、教育等領域幫助巨大。

　　由于GPT-4.1的發(fā)布，OpenAI宣布將會淘汰剛發(fā)布不久的GPT-4.5，其能力可見一斑。

　　目前，如果想體驗GPT-4.1而無法通過API身份驗證的小伙伴，微軟已經在Azure OpenAI上線了該模型，可以使用了。

　　GPT-4.1簡單介紹

　　GPT-4.1最大亮點之一就是支持100萬tokens上下文，這也是OpenAI首次發(fā)布長窗口模型。

　　與前代模型相比，GPT-4.1、GPT-4.1 Mini和GPT-4.1 Nano能夠處理多達100萬tokens的上下文，是GPT-4o的8倍。

　　OpenAI在Long Context Evals上對長文本進行了測試，測試結果顯示，GPT-4.1系列的三個模型均能夠在語料庫的任何深度找到目標文本，無論是開頭、中間還是結尾，甚至在長達100萬tokens的上下文中，模型依然能夠準確地定位目標文本。

　　OpenAI還在Multi-Round Coreference進行了測試，通過創(chuàng)建合成對話來測試模型在長上下文中的理解和推理能力。在這些對話中，用戶和助手交替進行對話，用戶可能會要求模型生成一首關于某個主題的詩，接著要求生成另一首關于不同主題的詩，然后可能要求生成一個關于第三個主題的短故事。模型需要在這些復雜的對話中找到特定的內容，例如“第二篇關于某個主題的短故事”。

　　測試結果顯示，GPT-4.1在處理長達128K tokens的數(shù)據(jù)時顯著優(yōu)于GPT-4o，并且在長達100萬tokens的上下文中依然能夠保持較高的性能。

　　在編碼能力測試中，SWEBench評估將模型置于 Python 代碼庫環(huán)境，讓其探索代碼庫、編寫代碼和測試用例。結果顯示，GPT-4.1 的準確率達到 55% ，而 GPT-4o僅為 33%。

　　在多語言編碼能力測試方面，Ader polyglot 基準測試涵蓋多種編程語言和不同格式要求。GPT-4.1 在差異性能上較 GPT-4o提升一倍，在處理多語言編程任務、代碼優(yōu)化和版本管理時更高效。

　　在指令遵循能力測試中，OpenAI 構建內部評估體系，模擬 API 開發(fā)者使用場景，測試模型對復雜指令的遵循能力。每個樣本包含分屬不同類別的復雜指令，并分難度等級。在困難子集評估中，GPT-4.1 遠超 GPT-4o。

　　在多模態(tài)處理測試的視頻 MME 基準測試中，GPT 4.1 對30 - 60 分鐘無字幕視頻進行理解并回答多項選擇題，取得72%的成績，達到當前最佳水平，在視頻內容理解上實現(xiàn)重大突破。

　　價格方面，GPT -4.1系列在性能提升的同時，價格更具競爭力。GPT -4.1 相比 GPT-4o 價格降低 26%，而GPT -4.1 Nano 作為最小、最快且最便宜的模型，每百萬 token 的成本僅為12美分。

　　實際應用GPT-4.1案例

　　湯森路透是全球領先的金融和法律信息提供商，其專業(yè)級AI助手CoCounsel被廣泛應用于法律工作。

　　CoCounsel的主要任務是幫助法律專業(yè)人士處理復雜的法律文件和工作流程。在測試GPT-4.1時，路透社發(fā)現(xiàn)該模型在多文檔審查方面表現(xiàn)出色，尤其是在處理涉及多個長文檔的復雜法律工作流程時。

　　與GPT-4o相比，GPT-4.1在內部長上下文基準測試中的多文檔審查準確性提高了17%。這一提升對于法律專業(yè)人士來說至關重要，因為它直接關系到CoCounsel處理復雜法律工作流程的能力。

　　法律文件通常包含多個長文檔，這些文檔之間可能存在復雜的相互關系，例如沖突條款或補充上下文。GPT-4.1在這些方面表現(xiàn)出了極高的可靠性，能夠準確識別文檔之間的細微關系，這對于法律分析和決策至關重要。

　　而在處理多個法律文件時，GPT-4.1能夠有效地維護跨文檔的上下文信息，并準確識別出文檔之間的沖突條款或補充信息。這

　　Carlyle是一家全球領先的私募股權投資公司，其業(yè)務涉及大量的金融數(shù)據(jù)分析和文檔處理。Carlyle使用GPT-4.1來從多個長文檔中準確提取顆�；慕鹑跀�(shù)據(jù)，這些文檔包括PDF文件、Excel表格和其他復雜格式。

　　Carlyle的內部評估顯示，GPT-4.1在從大型文檔中檢索數(shù)據(jù)方面的表現(xiàn)比其他可用模型高出50%。

　　GPT-4.1在處理非常大的文檔時表現(xiàn)出色，尤其是在密集數(shù)據(jù)的檢索方面。該模型成功克服了其他模型的關鍵限制，包括檢索問題、中間位置丟失信息的錯誤以及跨文檔的多跳推理。

　　這些能力使得GPT-4.1能夠更高效地從復雜的金融文檔中提取關鍵信息，為Carlyle的分析師提供了更準確、更全面的數(shù)據(jù)支持。

　　Windsurf是一家專注于提供高效開發(fā)工具的公司，其內部編碼基準測試為評估AI模型在實際開發(fā)中的表現(xiàn)提供了一個重要的參考。在對GPT-4.1進行測試時，Windsurf發(fā)現(xiàn)該模型在編碼任務中的表現(xiàn)比前代GPT-4o有了顯著提升：GPT-4.1在Windsurf的內部編碼基準測試中得分比GPT-4o高出60%。

　　Windsurf的用戶反饋顯示，GPT-4.1在工具調用方面比GPT-4o更高效，效率提升了30%。GPT-4.1在編碼過程中重復進行不必要的編輯或過度細化的步驟的可能性比GPT-4o降低了約50%。

投稿郵箱：chuanbeiol@163.com 詳情請訪問川北在線：http://www.fishbao.com.cn/

>>相關文章

OpenAI將放大招 GPT-5免費無限使用：預計幾個月內推出

微信安全中心發(fā)布公告，提醒用戶警惕木馬病毒

元氣森林與遠景科技集團達成全面戰(zhàn)略合作發(fā)布首款零碳氣泡水

菜鳥發(fā)布多款科技新品，涉及數(shù)字供應鏈與自動化

華為鴻蒙OS 3.0正式發(fā)布用戶數(shù)量已破3億

IDC發(fā)布中國Web應用防火墻（硬件）市場排名 | 綠盟科技WAF三連冠

阿里云發(fā)布CIPU處理器中國云廠商正在逐漸取得云計算核心話語權

騰訊極光投影P2新品發(fā)布硬核實力不容錯過

vivo S12系列新品發(fā)布時尚靚麗顏值高年輕人的最愛

川北在線-川北全搜索版權與免責聲明

①凡注明"來源：XXX(非在線)"的作品，均轉載自其它媒體，轉載目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點和對其真實性負責，本網(wǎng)不承擔此類稿件侵權行為的連帶責任。
②本站所載之信息僅為網(wǎng)民提供參考之用，不構成任何投資建議，文章觀點不代表本站立場，其真實性由作者或稿源方負責，本站信息接受廣大網(wǎng)民的監(jiān)督、投訴、批評。
③本站轉載純粹出于為網(wǎng)民傳遞更多信息之目的，本站不原創(chuàng)、不存儲視頻，所有視頻均分享自其他視頻分享網(wǎng)站，如涉及到您的版權問題，請與本網(wǎng)聯(lián)系，我站將及時進行刪除處理。

娛樂百科

360GAME

探索發(fā)現(xiàn)

愛美·BEAUTY

知識百科

精彩看點

卸妝液適合什么皮膚
保濕水什么時候用
Justin
世界上最小的國家只有2個人
冬天不想穿秋褲怎么辦？
小孩偷錢應該怎么正確教育

樂活	愛美
育兒	養(yǎng)生
探索	百科
游戲	硬件

娛樂	財經
體育	房產
文化	交通
文苑	教育

互聯(lián)網(wǎng)

科技	IT
百度	游戲
奇虎	讀報
搜狗	觀點

美女	社會
熱點	衛(wèi)生
搞笑	食品
綠植	美通社

合作媒體

金寵物綠植迷女邦網(wǎng) IT人

法律顧問：ITLAW-莊毅雄律師

Copyright 2010-2024 川北在線—川北全搜索版權所有

關于我們 |聯(lián)系我們 | 版權聲明 | 招聘信息 | 免責聲明 | 網(wǎng)站地圖 | 本網(wǎng)動態(tài) | 備案：陜ICP備2021004418號-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：

久久久一本精品99久久精品66,台湾佬美性中文在线播放,超清超清中文乱码字幕视频,亚洲中文台湾无码娱乐网

影音先锋男人色资源网,影音先锋男人资源在线观看,七七影音先锋色资源,最好最新高清中文字幕_被按摩的人妻中文字幕_亚洲中文字幕久久精品无码 99精品国产自在现线免费,国产免费久久精品99reswag,久久久一本精品99久久精品66,亚洲人成影院在线无码按摩店未满十八18周岁禁止免费国产_好爽好紧好大的免费视频国产_中文字幕天无码久久精品_潮喷视频在线色婷婷久久综合中文久久一本_在线视频一本转一区_日本一本草久国产欧美日韩