Google可以卷土重来并成为AI World的老板,每晚十二
发布时间:2025-04-12 09:36
今天早上,我看到Google在接下来的25台结束了他们的Google Cloud开口,并发布了将近20个与AI相关的模型,应用程序,开发工具和硬件。目前已经发布了许多内容,并且许多信息都散布在大量公告中。我选择了与AI和影响示范有关的关键点,并在整个网络中的接下来的25个AI中将对Google Cloud的最明亮解释结合在一起,以促进所有人维护最新发展。让我首先给您一个摘要:1。Google发布了许多重型和酷炫的AI模型和工具,但是有很多美丽的东西。请通过Google快速发布。 2。Gemini2.5 Flash即将发布,其推理成本性能很高。结合前面的2.5 Pro结合在一起,我们可以反对并成为AI行业的负责人吗? 3。特别是,发布了A2A协议,以使代理商能够无缝操作以主导全球代理的未来合作。扩展t他全文 4。完全披露了601个AI的AI实施Google AI的案例,为应用程序企业家提供了道路。 本文编写了5种新的AI模型,1个未来的AI协议以及其他6个主要更新。 5 AI模型更新 首先,有5种更新的AI模型。我发布了该委员会以进行快速审查: Gemini 2.5 Flash:紧密地,这是推理的模型,专注于快速廉价 以前,Google启动了Gemini 2.5 Pro推断模型,该模型具有100W令牌(对话超出上下文的措施,仍然可以遵循说明,并准确地记住了对交流的早期记忆),并支持多模式信号。在许多基准测试中都达到了最高等级。 它真的很强大。目前,Yize的每日型号为2.5 Pro。几天前,我受到了高度赞扬的“”,我用它来获得最佳体验效果。 现在,Gemini 2.5 Flash即将到来,与以前的发电相差Ation 2.0 Flash是: 目前,这是一种推理的模型,但它仍然延续了快速,廉价且易于使用的好处。 目前,这是一种推理的模型,但它仍然延续了快速,廉价且易于使用的好处。 推理的水平是根据对话中任务的复杂性的改编的变化(绝对有必要不吸引有关SA简单问题的理解原因); 原因级别是要适应通信任务的复杂性(绝对有必要不要对简单的理解问题感兴趣); 开发人员可以自定义模型的推理水平以促进成本控制; 开发人员可以自定义模型的推理水平以促进成本控制; 正式发布将需要一些时间,请等待更长的时间,并且可以尽快在Vertex AI上使用。 正式地,释放需要时间,等待更长的时间D它将尽快在顶点AI上使用。 VEO 2:视频生成最好的一代,打开等待的等待清单 VEO 2绝对是一个值得关注的视频生成模型,现在支持P视频,KeyFrame的VID Generatione,扩展图像,镜头控制和其他功能: P视频:不需要照片编辑,请从视频中删除不必要的元素。请注意,左侧的图片中有一条悬挂的电线,右图中的绳索自然受到惩罚。 P视频:不需要照片编辑,请从视频中删除不必要的元素。请注意,左侧的图片中有一条悬挂的电线,右图中的绳索自然受到惩罚。 关键帧视频生成:使用头部和尾屏(左侧是第一张图片,右图是最后一张图片)来生成视频,并且屏幕效果稳定。 关键帧视频生成:使用头部和尾屏(左侧是第一张图片和钻机HT是生成视频的最后一张图片),屏幕效果稳定。 扩展屏幕:您自然可以扩展现有视频。虽然效果不是特别先进,但在垂直版本中的一些水平视频中,它很方便地将文章提交到Tiktok等垂直内容平台。 扩展屏幕:您自然可以扩展现有视频。虽然效果不是特别先进,但在垂直版本中的一些水平视频中,它很方便地将文章提交到Tiktok等垂直内容平台。 镜头控制:当视频形成视频时,您可以调整镜头组成,摄像头和控制节奏,朝不同的方向移动相机,创建照片提取效果或生成遵循无人机的镜头。 镜头控制:形成视频时,您可以调整镜头组成,摄像头和控制节奏,朝不同的方向移动相机,创建效果s摄影,或产生遵循无人机的镜头。 PS:Google Vidoofx使用了VEO 2模型(我必须说Google产品门户和关系确实很复杂)。 注意:VEO2现已为WaiteList应用程序打开。请在本文结尾处获取申请地址。 评论:Google Cloud和Vertex AI之间的接口确实很难使用。如果不需要,最好等到C videofx c入口打开后才使用。 Chirp 3:在短短10秒钟的语音样本中创建现实的自定义语言 CHIRP 3还在VEO 2上更新了VETEX AI,这是对Google音频和发电的理解。 Chirp 3提供了35多种语言(包括中文)的自然和逼真的声音,并支持Walongs Seal选项。 突出显示1:支持在短录制的10秒内产生非常现实的自定义声音。 由于Chirp 3只能由今天的API调用,所以我无法入门原则。不确定要学习什么,您需要在10秒的短录制或任何清晰的录音中读取固定文本。 由于Chirp 3只能由今天的API调用,因此我无法直接启动。仍然不确定是否应遵循固定文本的10秒短记录,或者可以随意进行任何清晰的记录。 如果这是后者,那就非常友好。您可以使用游戏中字符和动漫中的任何音频来综合相应的虚拟人声音,这对于开发人员和Azaka非常重要。 如果这是后者,那就非常友好。您可以使用游戏中字符和动漫中的任何音频来综合相应的虚拟人类声音,这对开发人员和Azaka非常重要。 当然,我还希望Google能够主动制作安全技术,以防止他人使用其声音随意合成。 当然,我也希望Google能扮演Initia制定安全技术,以防止他人使用其声音随意合成。 突出显示2:确定音频扬声器的身份,并提高文本中音频使用的易用性。 长期以来,世界的痛苦音频音频音频音频无法认识到人类的声音。现在,我们现在可以区分“谁说句子”在录制许多演讲者时。这也是对这项技术的不可避免的需求。 长期以来,世界的痛苦音频音频音频音频无法认识到人类的声音。现在,我们现在可以区分“谁说句子”在录制许多演讲者时。这也是对这项技术的不可避免的需求。 会议,播客审查以及访谈和翻译记录的摘要将更加方便。 会议,播客审查以及访谈和翻译记录的摘要将更加方便。 Lyria:音乐生成模型的文字,也打开候补名单应用程序 莱利亚还使用Vertex AI更新,以创建从简单文本信号工作的完整音乐。 但是我还没有看到任何特殊的亮点,例如Conch Music,这也很好。 以下是官方演示音频: 注意:Ly现在已经开放是候补名单应用程序,并且该应用地址在文章的末尾。 Imagen 3:增强图像生成和编辑功能,通过拆除对象和图像修复更好 Imagen 3已发行了很长时间,并且“”通过ImageFX(Imagen 3)开发了许多有关产品,游戏和家庭设计形象的示例。它绝对是一种被低估的一流文学和艺术模式。 Yize通用文学和传记图片框架,测试ImageFX影响 Imenen改善了编辑/维修的效果,使您可以快速删除并重新删除图像中不必要的对象和缺陷。 下图是官方示范: 左侧的图片是原始图片,中间是旧版本,右图是Imagen3版本。 Imagen 3 Isas像以前一样稳定,其力量确实不满意。 您可以开始使用Gemini App ImageFX使用它。 1专用于未来2个代理的协议:一项新协议,允许代理商无缝工作 AI开发人员终于了解了Waytoagi社区和AI博客作者的共同努力中MCP是什么。 现在,Google已达成了特殊协议-Adment Agent 2。 如果您想阅读著名的科学,那么在门旁边发布了非常快速的数字肝皇帝,您可以去检查它:“。 一般的想法是: A2A是代理与代理商之间协作的开放协议,该协作适合人类保护的人类环境(MCP); A2A是代理商和代理商之间协作的开放协议,该协作适合人类人类(MCP)教学的人类Pro上下文; MCP专注于访问代理商的各种工具和信息; MCP专注于为代理提供各种工具和信息; A2A更专注于允许“您要使用的代理”(客户端代理)与“提供第三方支持的代理”(远程代理)(远程代理)相关联。前者负责组建和交付任务,后者负责执行; A2A更专注于允许“您要使用的代理”(客户端代理)与“提供第三方支持的代理”(远程代理)(远程代理)相关联。前者负责组建和交付任务,后者负责执行; 在A2A连接过程中,代理可以互相发送消息,传达上下文,响应信息等; 在PROSA2A连接ESO期间,代理可以互相发送消息,以上下文,响应等方式传达信息; A2A协议连接可能需要很长时间,直到完成任务。 A2A协议连接可能需要很长时间,直到完成任务。 官员还发布了一个vid演示的EO,以查看影响: 当然,将来拥有类似A2的ADENTENTENTENTENS AI代理时,具有A2A型协议非常重要。 但是,无论如何,今天,当类似MCP的生态系统听起来不听并且可以将工作流视为代理时,也不需要普通人,甚至大多数开发人员都会过分关注A2A协议。 不要认真。 如果您想研究技术,则可以切换到GITHUB官方存储:https:// github.com/google/a2a 其他AI应用程序,开发人员工具和601个案例 除了A2A模型和协议的先前更新外,Google还为普通用户和开发人员以及601个真实的AI应用程序案例更新了许多应用程序和开发工具。 仅根据主观优先级选择几个基本要点: Firebase Studio:配备最强AI的云AI编程工具,支持A单击扩展应用程序 Google还发布了自己的AI程序。工具。多亏了Google Cloud Cloud Resources,开发人员可以使用Firebase完成整个一站式应用程序开发过程。 包括所有来自AI编码,编译和构建,云服务部署以及操作中的全部。 它确实很方便,并且不需要下载IDE,并且可以在云中完成AI编程。 他们的主页就是这样。 特定的编码接口就是这样,并且操作体验与其他AI编程应用程序一致。 多亏了最强大的双子座2.5 Pro的祝福,您可以体验这个世界上一流的编码体验。 您可以访问https://idx.google.com/进行体验。 ADK:Google Agent开发的新大纲 ADK,名称开发的全名。它也是一个新发布的Google开发框架,适用于开发多古系统。 以下是官方介绍的好处: 开发人员可以访问https://google.github.io/aDK-COC查看特定项目 Google Workspace:包括大量的AI服务 Google是Workpace Suite的许多AI功能。 带上更多的AI功能,其中包括Doc,床单,聚会,聊天等诸如Day Day工具等: 您可以制作Audio版本的Google音频版本,或以播客样式汇总文档重点; 您可以制作Audio版本的Google音频版本,或以播客样式汇总文档重点; Google文档添加了“帮助我”功能; Google文档添加了“帮助我”功能; VID可用于制作VEO2视频; VID可用于制作VEO2视频; 床单支持使用AI自动研究数据并生成洞察力。 床单支持使用AI自动研究数据并生成洞察力。 顺便说一句,普通用户cannot在Google文档上体验了它。 Google AI Studio General UI优化 Google目前没有选择优化其Google Cloud Console设计,而是CHOSE继续优化AI工作室。 总体设计风格比双子座的Web应用程序更清晰。这有点大,还不错,更易于使用。 AI案件由Google从601个真正的客户带来 Google已更新了他们在过去一年中推广的AI客户案例。 在去年的接下来的24个中,Google Cloud在此列表中只有101个案例,现在还有500个案例。展示他的肌肉。 使用双子座来总结601的这些应用情况,涉及的应用程序方案如下: 客户代理:改善客户服务(例如聊天机器人,ipsyalized建议,订单处理); 员工代理:提高员工效率(例如自动活动,信息获取,内容和协作); 创意代理:加速创造性内容的生成(例如广告,图像,视频,文案); 代码代理:帮助开发软件(例如代码,奉献精神和高理想的生成构成代码的基础); 数据代理:加强数据和观点评论(例如模式识别,预测,供应链,数字双胞胎); 安全安全:改善安全保护(例如威胁,预防欺诈,合规性)。 客户代理:改善客户服务(例如聊天机器人,个性化建议,订单处理); 员工代理:提高员工效率(例如自动活动,获得信息,内容的生成和协作); 创意代理:加速创造性内容的生成(例如广告,图像,视频,文案); 代码代理:帮助开发软件(例如代码的生成,奉献和理解代码的基础); 数据代理:加强数据和观点评论(例如模式识别,预测,供应链,数字双胞胎); 安全安全:改善安全保护(例如威胁,预防欺诈,合规性)。 我相信会有很多启发许多AI公司的配给解决方案(尤其是在B中)。 详细的案例集合在这里:https://cloud.google.com/transform/101-real-world-neated-iuses-iuss-from-industry-Leaders Ironwood TPU:第7代Google AI芯片,旨在推理 Google很快将推出他们的第七代AI芯片“ Ironwood”,该芯片是他们最佳和可扩展的自定义AI加速器,直到现在,也是第一个用于推理的设计。 它已正式宣布,在上一代trillium中,铁木峰计算的性能是5次,这大大提高了AI推断的效率。 除上述内容外,Google还更新了许多其他AI开发套件和解决方案。 在下一个2025中,请参见Google Cloud,这是一个完整的官方公告:https://blog.google/products/google-cloud/next-2025/ 几乎所有这些内容。我期待Gemini 2.5 Flash。您在等哪个更新? 您认为Google可以借下一个吗25这次成为AI世界中的大哥哥? 参考 公告的原始文本 [Google Cloud Next 25官方原始文本收藏]:https://blog.google/products/google-cloud/next-2025 双子座2.5Flash:https://cloud.google.com/blog/products/ai-machine-learning/gemini-2-5-pro-flash-on-rtex-i 顶点AI-VEO 2/chirp 3/lyria/imagen 3:https://cloud.google.com/blog/products/ai-machine-bearning/expanding-ebanding-enerative-enerative-menerative-media-media-for- enterprise-enterprise-en-on-on-1l-On-velex-i A2A:https://developers.googlog 代理开发套件:https://开发人员 Google Workspace:https://blog.google/products/worksspace/cloud-e next-2025-workspace-gemini/ 601 Google AI的实施案例: https://cloud.google.com/transform/101-real-world-neated-iuses-from-from-from-industry-Leaders Ironwood TPU:https://blog.google/products/google-cloud/irinwood-s 文章中提到的经验丰富的内容 Firebase Studio:https://idx.google.com/ Google AI工作室:https://aistudio.google.com/ Chirp 3:https://cloud.google.com/text-to-seech/docs/chirp3-hd Imagen 3:https://labs.google/fx/zh/tools/image-fx 候补名单应用地址 VEO 2:https://docs.google.com/forms/d/e/1faipqlsfdksqf4brbfzax5l1gemx7dlbtjozkja4duii3utietcb-0hg/viewform Lyria:https://docs.google.com/forms/d/1yktciiizyze6txfknq9pzybxglzoeh0ljmunhjubi1m/viewform 该内容是该集合的免费视角,并不代表Huxiu的位置。未经许可,不允许复制。有关同意书,请联系[email protected]返回Sohu以查看更多信息