风海网 > 社会 > 正文

谷歌Gemini“悄悄变强”，快速缩小与GPT-4o差距，中文更是完成了超越！

2024-06-01 08:23 来源：风海网点击：

谷歌Gemini“悄悄变强”，快速缩小与GPT-4o差距，中文更是完成了超越！

尽管亮相时被 OpenAI 压了一头，但谷歌一直在悄悄迭代 Gemini 大模型，和 OpenAI 最新大模型 GPT-4o 的差距已经显著缩小。最新测试结果显示，Gemini 1.5 Pro/Advanced 在综合测试中排名第 2，逼近 GPT-4o，轻量版 Gemini 1.5 flash 排名第 9，超越 Llama-3-70b，接近 GPT-4。

相比 4 月份的版本，免费的 Gemini Pro 和 Flash 的能力有明显加强。且上下文长度可以达到 100 万 token，远远超出 GPT-4 的 12.8 万 token。

Gemini 的中文能力更是惊艳，在中文测试中，Gemini Pro 和 Advanced 双双超越 GPT-4o，分别排在第一、第二位。

此外，在 Hard Prompts 测试中，Gemini 同样名列前茅。在 Hard Prompts 测试中，大模型需要面对那些更具挑战性的问题，Gemini 1.5 Pro 在这一测试中排名第二，仅次于 GPT-4o.

从大模型置信区间（Confidence Intervals）来看，Gemini 的测试结果也名列前茅。

值得一提的是，两周前，在 Google Gemini 更新撞档 GPT-4o 发布时。Gemini 因为羸弱的能力几乎引来了群嘲。根据多家科技博客的测评，即使谷歌已经对 1.5 Pro 进行了数月的改进，但从常识推理到多模态能力和代码能力，仍然无法与 OpenAI 最新的 GPT-4o 模型相媲美。唯一亮点就是更大的上下文窗口。如今谷歌 Gemini 取得了如此神速的进步，显示出 AI 界届黄埔军校仍然有深厚的技术底蕴。

相关标签：

上一篇：每一个王妈崛起都是警钟
下一篇：美国首次在羊驼体内发现禽流感病毒

每一个王妈崛起都是警钟

2024-05-30 23:31:39
情侣长得太像听网友劝去做亲缘鉴定，这就是“夫妻相”？

2024-05-30 23:29:23
多地域、多机型联动，东部战区海军航空兵昼夜砺兵！

2024-05-30 23:27:07
司机醉酒开着车胎爆了却浑然不知，佛山交警“一眼拿下”：刑拘

2024-05-30 23:24:51
全球求解难题，华为悬红200万！

2024-05-30 23:22:34
近两年我国肺结节比例增加？高危人群达1.5亿！钟南山发声

2024-05-30 23:20:18
突发山火，一处级干部被指救援时驾无牌车逆行，致1人死亡，最新回应：王某某

2024-05-30 23:18:02
黄仁勋财富首破1000亿美元！媒体预测：明年超过马斯克，成世界首富

2024-05-30 23:15:46
南方新一轮降水过程上线，明日强降雨中心移至华南北部

2024-05-30 23:13:30
武大靖回应被聘为大学教授：资质够格计划读博

2024-05-30 23:11:13
TVB知名演员廖骏雄去世，曾出演《射雕英雄传》《鹿鼎记》

2024-05-22 10:46:58
杭州某电商平台员工一年受贿 9200 余万被抓

2024-05-22 10:44:42
97年女孩爬武功山遇难

2024-05-22 10:42:26
台积电CoWoS先进封装产能告急！根本无法满足AI GPU需求

2024-05-22 10:40:11
旗下第一款“相机”，vivo X100 Ultra 手机亮相

2024-05-22 10:37:55
奥特曼打赌不会和ChatGPT谈恋爱关心他人是人类本性

2024-05-22 10:35:39
Redmi 13 4G 手机曝光：5030mAh 电池，售价 199 欧元起

2024-05-22 10:33:23
转发传谣属违法，一网民为博取关注多次转发谣言被行拘

2024-05-22 10:31:07
台积电亚利桑那州工厂发生事故，导致卡车司机死亡

2024-05-22 10:28:52
友达展示 Micro LED 新品：17.3 英寸对折屏、31 英寸单片大屏

2024-05-22 10:26:36

热门图文

申通快递收费标准价格表2022（申通快递费用查询）

申通快递收费标准价格表2022（申通快递费用查询）

日本第一男吹神，拓也哥(男人在他口中坚持不过3秒)

日本第一男吹神，拓也哥(男人在他口中坚持不过3秒)

热门排行

相关文章