4月12日,近期多家大模型进行更新,谷歌发布了更新版Gemini Pro 1.5,支持音频输入和系统提示,上下文窗口达到100万tokens,最长可以处理11个小时的音频文件或者1小时的视频文章,在没有任何声音字幕的情况下,也能够看懂电影的事件和情节!目前,Gemini Pro 1.5已经完全免费,在超过180多个国家发布,Gemini 1.5 Pro的API也暂时对开发者免费开放,用户可在谷歌AI Studio中获得API密钥!
除了处理能力的提升,Gemini 1.5 Pro还首次引入了本地音频(语音)理解功能,最长支持11小时音频/1小时视频输入,这使得它能够更好地理解和处理音频、视频文件,比如给定巴斯特·基顿拍摄的一个44分钟长度无声电影,Gemini 1.5 Pro可以读懂电影中的画面、事件和情节!
- Gemini API 改进
Gemini 1.5 Pro对API进行改进,新增JSON模式,这对于需要从文本或图像中提取结构化数据的应用程序非常有用,开发人员可以更容易地解析和使用模型的输出,简化文件的处理流程提高效率。
这些改进让Gemini API更加强大和灵活,为开发人员提供了更多的控制和定制选项,现在,Gemini 1.5 Pro不仅能够处理文本数据,还能够轻松对上传到Google AI Studio中的视频中的图像(帧)和音频(语音)内容进行推理!
- 全新的embedding
谷歌公开了新的embedding词嵌入text-embedding-004,在测试中展现了卓越的检索性能,谷歌已经免费开放Gemini 1.5 Pro,谷歌鼓励开发人员立即开始在Google AI Studio中使用Gemini 1.5 Pro。
新一轮的AI大模型竞赛仍在进行中,OpenAI更新了GPT-4-Turbo,Mistral也更新了Mixtral 8x22B,谷歌透露,上述更新只是众多改进的开始,谷歌希望通过持续的改进和社区参与,推动Gemini的发展。
ChatGPT:
聊天机器人——
聊天机器人——
ChatGPT移动端——
微软——
ChatGPT王炸官宣——
火爆全网——
英伟达重磅:
黄仁勋:
ChatGPT免费开源平替——
ChatGPT王炸升级——
ChatGPT史诗升级——
ChatGPT加强版——
ChatGPT王炸官宣——
ChatGPT重磅升级——
ChatGPT:
ChatGPT突发:
ChatGPT之父:
ChatGPT之父:
ChatGPT:
游戏界大变天:
人工智能“觉醒”:
ChatGPT最强挑战者:
ChatGPT最强竞品:
ChatGPT:!
ChatGPT:
ChatGPT:
ChatGPT:
OpenAI重磅突破:
OpenAI王炸——
谷歌官宣:
微软重磅官宣:
乔布斯剧本:
奥特曼回归?
奥特曼宣布:
奥特曼回归:
GPT商店上线:
OpenAI王炸官宣——
OpenAI新模型:
OpenAI新模型:
OpenAI估值:
OpenAI王炸:
OpenAI:
OpenAI创始人:
#免责声明#
①本站部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责。
②若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。
③如果本站有侵犯、不妥之处的资源,请联系我们。将会第一时间解决!
④本站部分内容均由互联网收集整理,仅供大家参考、学习,不存在任何商业目的与商业用途。
⑤本站提供的所有资源仅供参考学习使用,版权归原著所有,禁止下载本站资源参与任何商业和非法行为,请于24小时之内删除!