OPRR

OPRR 快讯深度活动

更多

Search Extension

header-langage

OpenAI开源PaperBench，重塑顶级AI Agent评测

2025-04-03 07:34

BlockBeats 消息，4 月 3 日，据 AIGC 开放社区消息，今天凌晨 1 点，OpenAI 开源了一个全新的 AI Agent 评测基准——PaperBench。这个基准主要考核智能体的搜索、整合、执行等能力，需要对 2024 年国际机器学习大会上顶尖论文的复现，包括对论文内容的理解、代码编写以及实验执行等方面的能力。

根据 OpenAI 公布的测试数据显示，目前知名大模型打造的智能体，还无法战胜顶级机器学习专业博士。但在辅助学习、了解科研内容方面很有帮助。

纠错/举报

本平台现已全面集成Farcaster协议, 如果您已有Farcaster账户, 可以登录后发表评论

热门文章

炒币赚两亿被骗归零，比大祥哥还夸张的故事

2025-04-24 19:50

上市公司开启 5 亿美元「买买买」模式，SOL 成为微策略们的下一个 BTC

2025-04-24 19:15

牛市回归，以太坊的Pectra升级能否扭转局势？

2025-04-24 14:57

12小时市值突破2500万美元，$JOS是真有东西还是又一个「内幕盘」？

2025-04-24 18:52

链上侦探持续监控

11小时前

某鲸鱼沉寂2个月后从Kraken转出27,411枚SOL，约合411万美元

14小时前

Cumberland已累计向Coinbase转入2261枚BTC

14小时前

Circle 2025年已于Solana链上铸造130亿枚USDC

14小时前

Fantom基金会10分钟前从Curve取回1107.4万枚CRV并转入Binance

24H重要资讯

2025-04-25

Binance Wallet上线第12期TGE OKZOO，要求45点Alpha积分

某新地址于5小时前建仓价值200万美元Fartcoin，另一波段鲸鱼则清仓其125万枚Fartcoin

Binance将于5月7日移除部分杠杆交易对

Alameda Research 6小时前将1000枚比特币转入新钱包地址

纠错/举报

提交

新增文库

仅自己可见

公开

保存

选择文库

新增文库

取消

完成