Gemini 1.5是什么
Gemini 1.5是谷歌发布的全新AI大模型,除了性能显著增强,还在长上下文理解方面取得突破,它可以处理多达100万token,实现了迄今为止任何大型基础模型中最长的上下文窗口。甚至能仅靠提示词学会一门训练数据中没有的新语言。
Gemini 1.5的主要特性
谷歌表示,与之前的 Gemini 1.0 Ultra 产品相比,1.5 新款在许多方面取得了显著的改进,能够更有效地处理信息并且运行时间更长。
性能提升:Gemini 1.5在多方面呈现出明显的性能提升,特别是在长篇文本理解方面表现突出。
文本框的长度:模型支持长达 100 万 token 的上下文窗口,这是迄今为止任何大规模基础模型中最长的上下文窗口。
多模态处理:Gemini 1.5 具备处理和理解视频、音频、文本和代码等多种数据形式的能力。
高效架构:使用混合专家(MoE)结构有助于提升模型在训练和推理过程中的效率。
深入阅读理解:可以处理大量信息,比如1小时的视频、11小时的音频、超过30,000行的代码或者超过700,000个单词。
复杂推理:可以对大量内容进行分析、分类和总结,比如阿波罗11号任务的402页记录。
理解与推理:跨越不同的方式,可以深入理解和推理视频内容,比如分析巴斯特·基顿的一部44分钟无声电影。
解决代码问题:能够处理和推导超过10万行代码,给出有益的修改建议和解释。
增强性能:1.5 Pro 在87%的基准测试中表现优异,比1.0 Pro 更出色,并与1.0 Ultra 有着相当的性能水平。
Gemini 1.5的操作方法
开发者和企业客户现在可以通过AI Studio and in Vertex AI申请试用1.5 Pro,其中有12.8万token上下文窗口,稍后可扩展到100万token。