news 2026/4/28 1:38:13

导航最新的生成式 AI 公告——2024 年 7 月

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
导航最新的生成式 AI 公告——2024 年 7 月

原文:towardsdatascience.com/navigating-the-latest-genai-model-announcements-july-2024-461f227f588f?source=collection_archive---------7-----------------------#2024-07-26

关于新模型 GPT-4o mini、Llama 3.1、Mistral NeMo 12B 以及其他生成式 AI 趋势的指南

https://medium.com/@tula.masterman?source=post_page---byline--461f227f588f--------------------------------https://towardsdatascience.com/?source=post_page---byline--461f227f588f-------------------------------- Tula Masterman

·发表于 Towards Data Science ·阅读时间 7 分钟·2024 年 7 月 26 日

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/2c1a54aec97e06bbaf4652cc58890eb2.png

图片由作者使用 GPT-4o 生成,展示不同的模型

引言

自 2022 年 11 月 ChatGPT 发布以来,几乎每周都有新的模型、创新的提示方法、创新的代理框架或其他令人兴奋的生成式 AI 突破。2024 年 7 月也不例外:仅在本月,我们就见证了 Mistral Codestral Mamba、Mistral NeMo 12B、GPT-4o mini 和 Llama 3.1 等模型的发布。这些模型在推理速度、推理能力、编程能力和工具调用性能等领域带来了显著提升,使它们成为企业使用的有力选择。

在本文中,我们将介绍最近发布的模型亮点,并讨论当今生成式 AI(GenAI)领域的一些主要趋势,包括增加上下文窗口大小、以及跨语言和跨模态的性能提升。

2024 年 7 月发布模型概述

Mistral Codestral Mamba

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/9ccaedb9551dbc596082350afb2a639e.png

图像由作者基于 Mistral AI Codestral Mamba 公告的结果创建

Mistral NeMo 12B

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/bff3c9eb1e34c83135461162a628694c.png

图像由作者基于Mistral AI NeMo 公告的结果创建

Mistral Large 2

GPT-4o mini

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/c9a13e62a7becc06958538e36a815f33.png

该图由作者根据Feynmans Learning Method结果绘制

Llama 3.1

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/450cbf33dfabb38a07c3b2ce3a1466a1.png

该图由作者根据Meta Llama 3.1 公告结果绘制

生成式 AI 模型的趋势

总的来说,所有规模的模型呈现出越来越强大的趋势,拥有更长的上下文窗口、更长的令牌输出长度以及更低的价格点。推动推理、工具调用和编码能力的提升反映了对能够代表用户执行复杂操作的代理系统的需求不断增加。为了创建有效的代理系统,模型需要理解如何分解问题、如何使用可用的工具以及如何在一次处理大量信息时进行调和。

最近,OpenAI 和 Meta 的公告反映了 AI 安全讨论的日益增加,两家公司展示了应对同一挑战的不同方法。OpenAI 采取了闭源的方式,通过采纳社会心理学和虚假信息领域专家的反馈以及实施新的训练方法来提高模型的安全性。相比之下,Meta 加大了其开源计划的力度,发布了新的工具,专注于帮助开发者减轻 AI 安全问题。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/323d506da8b3ee322752fc81dd3cf6d1.png

这张图片由作者使用 GPT-4o 创建,展示了一个闭源和开源模型竞争的竞技场。

结论

未来,我认为我们将继续看到通用模型和专业模型的进展,像 GPT-4o 和 Llama 3.1 这样的前沿模型将越来越擅长于分解问题,并在跨模态执行各种任务时表现得越来越好,而像 Codestral Mamba 这样的专业模型将在其领域中表现出色,并在处理更长上下文和微妙任务时变得更加得心应手。此外,我预计我们将看到新的基准,专注于模型在单次回合内同时执行多个指令的能力,以及越来越多的 AI 系统通过结合通用模型和专业模型协作执行任务。

此外,虽然模型性能通常是根据标准基准来衡量的,但最终重要的是人类如何看待模型的表现,以及模型在多大程度上有效地推动人类目标的实现。Llama 3.1 的发布包含了一张有趣的图表,展示了人们如何对 Llama 3.1 与 GPT-4o、GPT-4 和 Claude 3.5 的回答进行评分。结果表明,Llama 3.1 在超过 50%的示例中与其他模型平局,剩余的胜率大致在 Llama 3.1 和其挑战者之间分配。这一点具有重要意义,因为它表明开源模型现在可以在一个以前由闭源模型主导的领域中轻松竞争。

想要进一步讨论或合作?请通过LinkedIn与我联系!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/24 19:51:49

让Web文档预览体验飙升:Vue-Office全格式解决方案深度指南

让Web文档预览体验飙升:Vue-Office全格式解决方案深度指南 【免费下载链接】vue-office 项目地址: https://gitcode.com/gh_mirrors/vu/vue-office 在数字化办公日益普及的今天,Web应用中的文档预览功能已成为用户体验的关键环节。Vue-Office作为…

作者头像 李华
网站建设 2026/4/27 22:20:01

3步修复洛雪音乐音源故障:从无声到畅听的完整方案

3步修复洛雪音乐音源故障:从无声到畅听的完整方案 【免费下载链接】New_lxmusic_source 六音音源修复版 项目地址: https://gitcode.com/gh_mirrors/ne/New_lxmusic_source 当你打开洛雪音乐准备享受喜爱的歌曲时,却发现所有曲目都无法播放——这…

作者头像 李华
网站建设 2026/4/20 16:12:14

Kappa架构与Flink:构建实时大数据处理系统的最佳实践

Kappa架构与Flink:构建实时大数据处理系统的最佳实践 关键词:Kappa架构、Apache Flink、实时数据处理、流批一体、大数据系统设计 摘要:本文将带你深入理解Kappa架构的设计哲学与Apache Flink的核心能力,揭秘如何通过两者的结合构…

作者头像 李华
网站建设 2026/4/24 7:05:23

告别视频下载烦恼:BilibiliVideoDownload三步实现效率提升

告别视频下载烦恼:BilibiliVideoDownload三步实现效率提升 【免费下载链接】BilibiliVideoDownload 项目地址: https://gitcode.com/gh_mirrors/bi/BilibiliVideoDownload 你是否曾在通勤路上想离线观看B站视频,却被繁琐的下载流程劝退&#xff…

作者头像 李华
网站建设 2026/4/21 22:42:39

3个秘诀让LeagueAkari帮你提升英雄联盟游戏效率

3个秘诀让LeagueAkari帮你提升英雄联盟游戏效率 【免费下载链接】LeagueAkari ✨兴趣使然的,功能全面的英雄联盟工具集。支持战绩查询、自动秒选等功能。基于 LCU API。 项目地址: https://gitcode.com/gh_mirrors/le/LeagueAkari 你是否曾在激烈的排位赛中因…

作者头像 李华