黑科技GanOpenAI王炸新一波,向开发者开放满血o1,测试中全面超越人类博士专家,准确率达到78.3%,引领AGI新时代,黑科技GanOpenAI王炸新一波,超越人类博士专家,准确率78.3%,引领AGI新时代

facai369 音韵和谐 2024-12-26 2 0

黑科技GanOpenAI王炸新一波:向开发者开放满血o1,测试中全面超越人类博士专家,准确率达到78.3%:引领AGI新时代

在人工智能领域,英伟达于12月17日推出了Jetson Orin Nano Super,这是一款手掌大小的生成式AI超级计算机。这款开发者套件售价仅为249美元,以其卓越性能和亲民价格为商业AI开发者、爱好者和学生提供了一个强大的工具。英伟达CEO黄仁勋表示,Jetson Orin Nano Super的性能提升了70%,每秒可执行高达67万亿次的INT8运算。 OpenAI也不甘示弱,推出了最强推理模型o1,在多个基准测试中超越人类专家,预示着通用人工智能(AGI)的进一步发展。在为期12个工作日的线上新品和技术发布活动中,OpenAI宣布将o1向开发者开放,并在开发语音类App的API中纳入了收费更低的先进模型GPT-4o版本。 今年9月,OpenAI发布了o1的预览版o1 preview,称其是第一个具备真正通用推理能力的大模型。在GPQA-diamond测试中,o1的准确率达到78.3%,超过了人类博士专家的69.7%。此外,o1在美国数学邀请赛(AIME)中的正确率达到了83.3%,远超GPT-4o的表现。 12月5日,OpenAI推出了正式版o1,支持多模态输入并具备视觉推理能力。相比预览版,正式版o1的平均响应速度快了60%,犯重大错误的频率减少了34%。在编码、数学和视觉推理任务的一系列基准测试中,正式版o1取得了明显进步。例如,在SWE-bench Verified基准的编码测试中,o1的评分从41.3提高到48.9;在AIME测试中,评分从42跃升至79.2。

分享:

扫一扫在手机阅读、分享本文

最近发表