发布日期:2024-12-17 10:56 点击次数:103
作家:赵雨荷
开始:硬AI
为疏忽OpenAI此前推出的重大新家具,谷歌周三推出下一代重要东谈主工智能模子Gemini 2.0 Flash,不错原生生成图像和音频,同期撑握文本生成。2.0 Flash还不错使用第三方欺骗圭表和劳动,使其约略造访谷歌搜索、践诺代码等功能。
从周三起,2.0 Flash的实验版块将通过Gemini API和谷歌的AI确立平台(AI Studio和Vertex AI)提供。然则,音频和图像生得手能仅对“早期接入巴搭伙伴”敞开,并规划在来岁1月全面推出。
改日几个月内,谷歌示意将推出2.0 Flash的不同版块,用于Android Studio、Chrome DevTools、Firebase、Gemini Code Assist等家具。
Flash的升级第一代Flash(1.5 Flash)只可生成文本,且并未遐想用于终点高要求的使命负载。据谷歌称,新版块2.0 Flash模子更具种种性,部分原因是它约略调用器具(如搜索)并与外部API交互。
谷歌Gemini模子家具认真东谈主Tulsee Doshi示意,
“咱们知谈,Flash因其在速率和性能上的雅致均衡而备受确立者防备。在2.0 Flash中,它依然保握了速率的上风,但目下愈加遒劲。”
谷歌宣称,根据公司里面测试,2.0 Flash在某些基准测试中的运行速率是Gemini 1.5 Pro模子的两倍,并在编码和图像分析等范畴“权臣”更正。事实上,该公司示意,2.0 Flash凭借其更好的数学性能和“事实性”取代了1.5 Pro,成为Gemini的旗舰模子。
2.0 Flash不错生成并修改图像,同期撑握文本生成。该模子还不错读取相片、视频以及音频录制施行,从而恢复与这些施行关系的问题。
音频生成是2.0 Flash的另一个关键功能,Doshi将其态状为“可操控”和“可定制”。举例,该模子不错用八种针对不同口音和讲话优化的声息来诵读文本。
不外,谷歌并未提供2.0 Flash生成的图像或音频样本,因此无法判断其输出质地与其他模子的比较。
谷歌示意,它正在使用其SynthID技艺为2.0 Flash生成的总计音频和图像添加水印。在撑握SynthID的软件和平台(即部分谷歌家具)上,该模子的输出将被象征为合成施行。
此举旨在缓解东谈主们对糜费的担忧。事实上,“深度伪造”(deepfake)正成为日益严重的威逼。据身份考证劳动Sumsub的数据,从2023年到2024年,寰球检测到的深度伪造数目增长了四倍。
多模态API2.0 Flash的坐蓐力版块将于来岁1月推出。但与此同期,谷歌推出了一个API,名为Multimodal Live API,以匡助确立者构建具有及时音频和视频流功能的欺骗圭表。
通过Multimodal Live API,谷歌示意确立者不错创建具有来自录像头或屏幕音频和视频输入的及时多模态欺骗圭表。该API撑握器具集成以完成任务,并约略处理“天然对话方式”,举例打断——与OpenAI的及时API功能访佛。
Multimodal Live API已于周三上昼全面敞开使用。
AI代理操作网页谷歌周三还发布了其首个约略在网页上践诺操作的AI代理,这是由其DeepMind部门推出的斟酌模子,名为Project Mariner。该代意义Gemini驱动,约略汲取用户的Chrome浏览器,移动屏幕上的光标,点击按钮,填写表单,从而像东谈主类通常使用和浏览网站。
谷歌示意,从周三初始,这款AI代理将领先面向一小部分事先采取的测试者推出。
媒体报谈,谷歌正在持续尝试新的式样,让Gemini约略读取、回首甚而使用网站。一位谷歌高管告诉媒体,这标记着一种“全新的用户体验范式迁移”:用户不再凯旋与网站交互,而是通过生成式AI系统完成这些交互。
分析觉得,这种迁移可能会影响数百万家企业——从TechCrunch等出书商到沃尔玛等零卖商——这些企业一直以来皆依赖谷歌将信得过用户斥地到他们的网站。
在与科技媒体TechCrunch的演示中,谷歌实验室总监Jaclyn Konzelmann展示了Project Mariner的使命旨趣。
在Chrome浏览器中装配一个扩张圭表后,浏览器右侧会弹出一个聊天窗口。用户不错指示代理完成诸如“根据这份清单在超市创建购物车”之类的任务。
接着,AI代理睬导航到一家超市的网站,然后搜索并将商品添加到假造购物车中。一个可想而知的问题是代理运行速率较慢——每次光标移动之间约有5秒的蔓延。未必,代理睬中断任务并复返到聊天窗口,要求流露某些物品(比如需要几许胡萝卜等)。
谷歌的代理无法完成结账,因为它不会填写信用卡号或账单信息。此外,Project Mariner也不会为用户接受cookies,或签署劳动条件左券。谷歌示意,这是出于对用户更好限度的接头,有益不允许代理践诺这些操作。
在后台,股票投资谷歌的代理睬截取用户浏览器窗口的截图(用户需在劳动条件中欢跃这少量),并将其发送到云表的Gemini进行处理。然后,Gemini会将导航网页的指示发送回用户的电脑。
Project Mariner还不错用于搜索航班和旅社、购物家居用品、查找食谱以偏执他目下需要用户点击网页才略完成的任务。
不外,Project Mariner仅能在Chrome浏览器的最前端行径标签页上使命,这意味着在代理后台运行时,用户无法用电脑作念其他事情,而是需要不雅看Gemini迟缓场所击操作。谷歌DeepMind首席技艺官Koray Kavukcuoglu示意,这是一个相称专诚的决定,宗旨是让用户知谈谷歌的AI代理正在作念什么。
Konzelmann示意,
“[Project Mariner]标记着咱们目下看到的一种根人性的新用户体验范式迁移。咱们需要探索一种正确的程序,让这一切改变用户与网页互动的式样,同期也改变出书商为用户以及代理创建体验的式样。”
AI代理作念斟酌、写代码、纯属游戏除了Project Mariner,谷歌周三还推出了几款专门用于特定任务的新AI代理。
其中一个AI代理Deep Research旨在通过创建多要领斟酌规划匡助用户斟酌复杂斟酌。它似乎是OpenAI的o1的竞争敌手,后者也约略进行多要领推理。然则,谷歌发言东谈主指出,该代理并毋庸于措置数学和逻辑推理问题、编写代码或进行数据分析。Deep Research现已在Gemini Advanced中推出,并将在2025年登陆Gemini欺骗。
当收到一个珍藏或范畴较大的问题时,Deep Research会创建一个多要领的行径规划来恢复问题。在用户批准规划后,Deep Research需要几分钟的时候来恢复问题、搜索网页,然青年景一份详备的斟酌阐发。
另一个新AI代理Jules旨在匡助确立者完成代码任务。它凯旋集成到GitHub使命流中,使Jules约略放哨现存使命并凯旋在GitHub中进行转换。Jules现已向一小部分测试者推出,并将在2025年晚些时候发布。
临了,谷歌DeepMind示意正在确立一款用于匡助用户纯属游戏的AI代理,这是基于其在创建游戏AI方面的长久告诫。谷歌正在与Supercell等游戏确立商迎合测试Gemini讲明《部落突破》等游戏宇宙的智商。
AI生成摘要谷歌周三还发布了基于Gemini 2.0模子的AI生成撮邀功能“AI Overviews”,为某些Google搜索查询提供的摘要施行,将很快约略处理“更复杂的话题”,以及“多模态”和“多要领”的搜索施行。谷歌示意,这包括高等数常识题和编程问题。
新的AI Overviews功能将在本周初始进行有限测试,并将在来岁头平日推行。
不外,自本年春天推出以来,AI Overviews激发了很多争议,其提供的某些可疑述说和提出(举例推选在披萨上加胶水)曾在网上激发烧议。根据SEO平台SE Ranking的一份最近阐发,AI Overviews援用了“并不彻底可靠或基于凭据的”网站,包括落伍的斟酌和付费家具列表。
分析觉得,主要问题在于,AI Overviews未必难以永别信息开始是事实、虚构、讪笑照旧严肃施行。以前几个月里,谷歌改变了AI Overviews的使命式样,落拓了与局势和健康话题关系的谜底。但谷歌并不宣称这一功能仍是绰有余裕。
尽管如斯,谷歌示意,AI Overviews教学了搜索参与度,尤其是在18到24岁这一关键用户群体中——这是谷歌的重心方向东谈主群。
最新AI加快器芯片Trillium 专供Gemini 2.0谷歌周三发布了其第六代东谈主工智能加快器芯片Trillium,宣称这一芯片的性能更正可能从压根上改变AI确立的经济方式。
这款定制处理器用于考研谷歌最新发布的Gemini 2.0 AI模子,其考研性能是上一代的四倍,同期大幅裁减了能耗。
谷歌首席践诺官桑达尔·皮查伊(Sundar Pichai)在一篇公告著作中讲明谈,谷歌仍是将荒谬10万颗Trillium芯片相连在一个单一的麇蚁合构中,变成了寰球最遒劲的AI超等揣测机之一。
Trillium在多个维度上结束了权臣的越过。与其前代比拟,这款芯片每颗芯片的峰值揣测性能教学了4.7倍,同期高带宽内存容量和芯片间互联带宽均翻了一倍。更为重要的是,它的能效教学了67%,这是数据中心在疏忽AI考研庞杂能耗需求时的一个关键策动。
Trillium的买卖影响不仅限于性能策动。谷歌宣称,与上一代芯片比拟,该芯片在每好意思元的考研性能方面教学了2.5倍,这可能会重塑AI确立的经济方式。
分析觉得,Trillium的发布加重了AI硬件范畴的竞争,而英伟达凭借其基于GPU的措置决策长久占据主导地位。天然英伟达的芯片仍然是很多AI欺骗的行业模范,但谷歌的定制芯片程序可能在特定使命负载,终点是考研相称大的模子方面具有上风。
还有分析称,谷歌在定制芯片确立上的大宗投资反馈了其对AI基础设施重要性的策略押注。谷歌决定将Trillium提供给云客户,这标明其但愿在云AI阛阓上更具竞争力,与微软Azure和亚马逊AWS张开热烈竞争。关于总计这个词科技行业而言,Trillium的发布标明AI硬件霸主之争正插足新阶段。
本文来自微信公众号“硬AI”,暄和更多AI前沿资讯请移步这里
风险提醒及免责条件 阛阓有风险,投资需严慎。本文不组成个东谈主投资提出,也未接头到个别用户荒谬的投资方向、财务气象或需要。用户应试虑本文中的任何办法、不雅点或论断是否合适其特定气象。据此投资,连累惬心。Powered by 中证配资 @2013-2022 RSS地图 HTML地图
建站@kebiseo; 2013-2024 万生优配app下载官网 版权所有