OpenAI 和 Paradigm 启动 EVMbench 测试 AI 智能合同包Blockchain.News2026年3月5日分享新基准评价AI代理商检测,补丁,利用智能合同弱点的能力. GPT-5.3-Codex在开发任务上得分72.2%. (多读)LAUNCHEXPLOITHACK