Gemini 1.5 | 谷歌新一代AI大模型

Gemini 1.5是谷歌发布的全新AI大模型，除了性能显著增强，还在长上下文理解方面取得突破，它可以处理多达100万token，实现了迄今为止任何大型基础模型中最长的上下文窗口。甚至能仅靠提示词学会一门训练数据中没有的新语言。

谷歌表示，与之前的 Gemini 1.0 Ultra 产品相比，1.5 新款在许多方面取得了显著的改进，能够更有效地处理信息并且运行时间更长。

性能提升：Gemini 1.5在多方面呈现出明显的性能提升，特别是在长篇文本理解方面表现突出。

文本框的长度：模型支持长达 100 万 token 的上下文窗口，这是迄今为止任何大规模基础模型中最长的上下文窗口。

多模态处理：Gemini 1.5 具备处理和理解视频、音频、文本和代码等多种数据形式的能力。

高效架构：使用混合专家（MoE）结构有助于提升模型在训练和推理过程中的效率。

深入阅读理解：可以处理大量信息，比如1小时的视频、11小时的音频、超过30,000行的代码或者超过700,000个单词。

复杂推理：可以对大量内容进行分析、分类和总结，比如阿波罗11号任务的402页记录。

理解与推理：跨越不同的方式，可以深入理解和推理视频内容，比如分析巴斯特·基顿的一部44分钟无声电影。

解决代码问题：能够处理和推导超过10万行代码，给出有益的修改建议和解释。

增强性能：1.5 Pro 在87%的基准测试中表现优异，比1.0 Pro 更出色，并与1.0 Ultra 有着相当的性能水平。

开发者和企业客户现在可以通过AI Studio and in Vertex AI申请试用1.5 Pro，其中有12.8万token上下文窗口，稍后可扩展到100万token。

相关问题