纳米双子座队

Web3 SkyCity |城市之王:关心AI进步的人肯定会错过过去两天的Google的“香蕉”模型。 Google发行的最新一代模型和图像编辑再次将回忆起对AI形象的人的理解。说该模型直接结束Adobe Photoshop版本和AI模型的紧身图像的所有应用程序并不是夸张的,这不是必需的。总而言之,该模型几乎可以满足图像更改的所有需求,包括照片编辑,角度更改,衣服,样式更改等。效果是完美的。此外,我相信最强大的技能将在接下来的几天内继续发现。以下是关于双子座“纳米巴纳那”本地图像生成模型的主要演变的讨论。负责本地G模型能量的中央团队(Nanobanana内部代码名称”) – Nicole,Kaushik,Mostafa和Robert-透露了“巨大” JUMP。这不仅是技术的传统迭代,而且还告诉我们AI创建工具的范式转变。从简单的指导执行者到可以参加重复对话的“智能创意合作伙伴”,了解深刻的意图并处理前所未有的复杂任务。这次对话介绍了即时生成和版本的令人难以置信的能力,更彻底地研究了一个独特的评分系统,该系统促进了未来模型和飞机的演变,以“事实”和“ Overs”。 。在加深技术细节之前,以下是这次对话最中心的观点的摘要:“这是质量的巨大飞跃。模型是前卫 – garde,我对它的发电能力和编辑功能感到非常兴奋。” “未来的地址是,该模型不仅会产生高质量的图像,而且还了解深刻的意图。除了用户的说明之外,它还具有更具创造性的结果,可确保可靠性和准确性Of内容。 ”“这个迭代创作过程是背后的魔力。它仍然非常快,因此我可以再次运行并迅速迭代。 “基于对话的创造性革命此更新的核心在于“多模式的本地”架构。与一系列对话有关。这完全改变了人类计算机协作的本质。在现场演示中,产品经理可以轻松地使用主机照片来立即为背景和性格创造性图纸,并在其角色上表现出“善于使用gneft and naturally banaana of Sunderny of naturally the naturally the natural of ban bannana offit”。指示:“我们要去纳米斯卡群岛。”该模型不仅可以报告错误,而且还产生了一个美丽的“迷你版”的图像。E场景与多个版本一致,并允许用户以非常自然的语言与模型进行交互。” Nicole解释说。该功能来自于模型同时canumperandand和Process同时进行文本和图像上下文的事实。研究人员Kaushik补充说:“这就是所谓的本机图像生成模型。在生成图像之前,它可以访问多模式状态的上下文。“该体系结构的直接结果是“像素级别的完整版”,由团队强调。他们是在八十年代更改八十年代的五个不同的服装还是重新设计自己的花园,该模型可以使某些部分修改在构建场景的其他元素(例如构建角色)的其他元素(如果您是一个构建的角色)。 特点。但是在每种情况下,它们使用的所有内容都必须相同。妮可说,这个模型在这方面做得很好。更重要的是,一切都笔以非常高的速度。复杂的5个高分辨率图像同时需要13秒。罗伯特(Robert)强调说:“即使您不时失败,您只需要调整通知并重新执行它。”因此,我认为这个重复性的创造过程是背后的魔术。这是一个全新的范式,它允许模型以多个可执行的步骤分解高度复杂的指令,并以令人难忘的顺序和顺序完成它们。 “您可以要求该模型分解复杂的线索并在不同的步骤中进行一个一个一个一个一个逐个编辑。”这意味着他们不再需要大脑来设计完美的“最后轨道”,而是逐渐构建复杂的场景,例如与Live de沟通签名者。这类似于语言模型中的一系列思想,但它智能地应用于像素空间。 Mostafa说:“我们花费更多的浮点操作,并确保该模型基本上将这个想法带入像素空间。”这种增量生成的方法可以处理理论上复杂的任务,并完全破坏传统的一部分生成模型的瓶颈。超越主观性:文本的表示会成为进化的规则吗?在每个人都可以表达对美学意见的领域,简单地相信人类的偏好进行评估是昂贵且缓慢的。为此,双子座团队发现了意外的近距离功能,但非常有效:文本表示。罗伯特回忆说:“我认为文字表示始终是一个非常有趣的故事。”起初,考希克(Kaushik)是团队中唯一被这个指标“着迷”的人,但所有人都逐渐发现了他们的深厚价值。 “当模式时l学习如何为文本构建这样的结构,可能会认为其他结构可以在图像中学习。特征。 “毕竟,这种曾经看到的“疯狂”痴迷已成为一个重要的信号,它在结构和详细的绩效中推动了模型的进步。未来的观点:当被问及该模型的未来方向时,团队的反应是令人惊讶的一致,“智力”的“智力”事实。 ““行为。”他追求的是“智力”,它使他能够理解用户的深刻意图,并以更好的方式理解“更正”或“升华”的指示。 “我觉得我正在干预磁带的一部分的系统。” “供应。”从更实际的角度来看,Orn渴望“事实”。确实必须有必要。 “这告诉我们,AI产生的内容从纯粹的创意领域转变为需要严格和精确的专业场景。”我梦见,有一天这些模型确实可以为工作做出目标演示。简介Sky City的全文汇编:图像生成主持人的质量跳跃:今天,我们将与推出新模型生成的团队讨论本机图像。妮可:这对群众来说是一个巨大的飞跃。该模型是前卫 – garde。是的,我对生成和编辑功能感到非常兴奋。 Kaushik:例如,您可以要求从不同角度呈现角色,并且看起来完全像原始角色。 MOSTAFA:当用户与此交互时,他们不仅对图像的质量印象深刻,而且令人惊讶,我认为这是DeandIntelligent Nicole:您可以与该模型进行多次有趣的对话。罗伯特:所以,我认为这个重复和创造性的过程是他背后的魔力。妮可:我认为我们正在触摸这些模型可以做什么的皮毛。主持人:大家好,欢迎发表说明。我叫洛根·基尔帕特里克(Logan Kilpatrick)。我在Google DeepMind团队中。今天,我们有Coshke,Robert,Nicole和Mustafa。他们是调查和开发产品的人,我们的双子座本地图像生成模型,我们打算今天讨论这种模型。我为此感到非常兴奋。妮可,您想先开始吗?什么好消息?我很高兴听到已发表的通知。妮可:是的,我们正在启动用于生成图像的更新以及Gemini和Tutor 5 Flash的编辑功能。这对于群众来说是一个很大的跳跃。这个模型是前卫 – garde,我对功能代和编辑感到非常兴奋。为什么这个模型不显示您可以做什么?因为我认为这是传达这一点的最佳方法。主持人:我很兴奋。我可能已经尝试过一次,但是我没有像你那样强烈地发挥作用。所以我很高兴看到一些例子。真实的 – 时间示范:从香蕉到“纳米斯卡”创意妮可:很好。我会拍照。现在,让我们展示它在巨大的香蕉服装中的外观,我们使您的脸看到。我花了几秒钟的时间来建造,但是它仍然非常柔软,我想我记得我推出的最新版本。这似乎是一个非常快速的模型。主持人:这是我的最爱之一。有这种编辑速度使这些模型非常有趣。一点,你能帮我吗?全屏可用。我认为是这样。您想点击此吗?单击。妮可:让我单击此。好的,仅此而已。这是洛根。它仍然是你的脸。 m该模型的e Mejor是它看起来仍然像您,对吗?这就像您一样,但这就像使用巨大的香蕉套装。现在有一个美丽的背景,您在城市中漫步。主持人:这张照片是在芝加哥拍摄的,看起来真的像这样,所以非常有趣。妮可:那么,这个模型具有全球知识。因此,让我们继续前进,假设它将是纳米斯卡拉。主持人:这是什么意思? “纳米斯卡拉”是什么意思?妮可:让我们看看。让我们看看这个模型的作用。当他第一次在LM Arena发射时,他给了他一个名为“ Nanobanana”的代码名称。是的。然后人们开始推测这是我们更新的模型。当然,这是我们更新的模型。就这样。这样,该模型将提取您的信息,使用巨大的香蕉服装,并创建您的精美迷你版本。主持人:我喜欢这个。奇妙。妮可:最好的事情显然是一个非常大的线索,对吗?作为DICE,这是什么意思?主持人:我不知道真的是什么方法。妮可:但是该模型足以解释它,然后创建一个知道并满足您的问题的场景。在上下文中,这仍然是有道理的,并将其关联到场景的其余部分。这是非常令人兴奋的。这是因为我认为这是我第一次看到一个很棒的语言模型,该模型实际上维护了由多个版本组成的场景,并允许用户以非常自然的语言与模型进行交互。好的。无需输入很长的消息。我可以在多个回合中与模型进行有趣的对话,因为我将其提供给非常自然的语言说明。这是非常令人兴奋的。 TextGu表示:测量模型进度主持人的重要指标:我喜欢。从文本表示的角度来工作?这是我最相关的用例之一吗?您想在照片中添加一些东西吗?妮可:你能给我一些线索吗?主持人:双子座Nano。这是我认为与纳米有关的唯一一件事。发布推文我认为有符号上的文字是我一直想做的一种使用情况。那是我最喜欢的用例。妮可:好吧,让我们开始。你还好吗?好的。这是一个相对简单的文本,对吗?是的,字母的数量很少,都是简单的单词,效果非常好。我已经提到了版本中文本表示的一些不便,但我正在努力解决这个问题。团队中的公司可以谈论这个问题,但他们正在努力使文本表示在下一个模型中变得更好。主持人:我喜欢。您想向我们展示另一个例子吗?还是有关此发布的其他指标故事?我知道挑战之一,但我很想知道您对此的看法,如何评估历史学。这大部分是关于人类偏好的,这就是您的衡量。很难有一个故事之类的东西。我认为有些事情可以发现真相的来源,但我很好奇EE您如何看待此发射以及训练这些模型时的内容。罗伯特:我认为通常,图像和视频之类的东西是多模式的。您知道,过去的方法很难使用许多人造偏好来在山上攀登。显然,这些图像非常主观。因此,您就像收到一大批人的迹象,是吗?这不一定是最快的指标,它已经很长一段时间来获得评论。总的来说,我一直在努力在培训期间发送其他指标进行攀登。文字表示非常有趣,因为它是一个深刻的故事。因为我认为Kauschick很长一段时间以来一直在谈论ESO。他是我们最伟大的追随者之一,我们一直在对他做些不舒服的事情,以为这个家伙有点疯狂,他对文本信息的代表着迷。但最终,这就像我们关注的主要事情之一S ON,当模型学习如何为文本构建此结构时,我们可以考虑一下。您还可以学习图像中的其他结构。像图像一样,您可以拥有这些不同的频率,结构,并且可以考虑它们,但是您也可以具有纹理等。这给出了一个信号,即生成场景结构的模型是多么好。他是负责人,所以我请考西克说一点。主持人:是的,我也对我最初的信念感兴趣。当我进行许多研究实验时,这很明显。是的,我想看更深。 Kaushik:是的,我认为这始于对这些模型的理解。因此,改进任何模型都需要信号来指示什么不起作用。接下来,我们将尝试许多想法,是否与模型的架构数据有关。一旦您发出明确的信号,它肯定会很好。回顾几年前,​​很少有模型可以起作用,甚至是FAS测试单词是诸如双子座Nano之类的简短祈祷。因此,我花了更多时间研究这个指标并不断跟踪它。无论您现在正在进行的实验如何,对此指标的监视都将帮助您防止此时移动。您可以看到,仅仅因为您将其用作信号会影响意外的更改,然后您可以随着时间的推移继续改进该指标。是的,正如罗伯特(Robert)所说,如果他没有其他图像质量指标(他没有立即饱和),那么这是测量成像质量的一般质量的绝佳方法。人类,我认为我确实有一个小问题,即如何评估人类雷达等图像的产生。但是,至少我逐渐意识到有几类。但是很明显,它很昂贵,您不想让很多人总是会欣赏图像。因此,例如,在模型培训期间查看此文本表示指标,可以是否应该期望它的迹象。本地多模式:理解和发电的客人共同进化:这很有趣。我对本地图像产生技能和本地图像理解技能之间的互动感兴趣。我们与ANI团队一起做了一个计划,他们显然正在努力促进前进,其中包括对最先进形象的Gemini。当我们的模型做得更好时,这是一个理性的心理模型吗?这些技能中的某些技能也被转移到世代,反之亦然。 Mostafa:从本质上讲,它将产生一代本地图像,或者是本地的多模式理解和一代,希望通过相同的培训执行,您将学习所有这些举止和不同的技能。这不仅仅是理解和生成单个模态。这也取决于您是否可以学习有关图像,视频或音频世界的知识来帮助您nderstand并生成文本。因此,对图像的理解和图像的产生无疑是姐妹。因此,我们仍然看到它们共同努力,例如受膏剂之间的一代。但是最终的目标是查看。让我们举个例子。例如,用语言,这种现象称为报告偏见。这意味着您回到家里的朋友,回来时从不提及您的常规沙发。好的。但是,如果您向某人展示房间的照片,沙发就在那里。好的。因此,如果您想在一个世界中了解很多图像和视频,则每个人都包含这些信息而无需明确要求。所以我说的是,您终于可以通过文本学习许多不同的方式,但这可能需要更多的筹码。因此,视觉信号绝对是了解世界的好捷径。正如我所说,回到理解和世代的问题时,这两个是紧密相连的,我去了互动的一代等级。从理解到更好的世代,反之亦然,我们可以看到实际上有很大的帮助。因此,您知道生成图像可以帮助您在板上绘制一些问题来解决问题。因此,我们可以更好地理解出现的不造成图像的问题。因此,我们实际上可以展示与理解和文本生成密切相关的交织的几代人。 Interleave Generation:解锁复杂的创意流妮可:让我这样做。将主题以五种不同方式转变为八十年代的美国购物中心的图像。主持人:我明白。妮可:我希望这有效。好的,这似乎很有希望。显然,这需要花费时间尝试生成多个图像。他们还尝试生成描述这些图像内容的文本。 Kaushik:关于本机图像的产生,您会注意到的一件事是一一生成这些图像。因此,该模型可以选择显示上图并生成某个图像与之完全不同,或尝试产生轻微的更改。至少有生成内容的上下文。因此,这就是我们所说的本地图像生成模型。您可以在生成图像之前访问多模式上下文。主持人:是的,这很有趣。我的心理模型一直都是这样。但这就像四个独立的提前传输之类的东西。但这实际上只是一个。所有这些都是在模型的背景下。所有这些都是在模型的背景下。这很有趣。妮可:更好,风格有点相似。该模型仍然可以做一些有趣的事情。这意味着可以在所有照片中两次显示。主持人:有趣。我可以将其中一些放在全屏上吗?这是阿卡达斯国王洛根。搬家,你是个好人。妮可:是的,如您所知,这些照片所附的解释不是我们发生的。快点好像他们在1980年代在美国魅力购物中心商店里一样。大鼠购物中心。这些应该考虑使用TFIT。第四个选择是轻松的兄弟。如您所知,您在Cadto照片中有不同的服装。每个人都类似于你。它在每个图像中出现两次,但这处于较低的故障模式。但是,很高兴看到这些模型提出了这五个不同的想法。给它一个不同的名字。再给我一套衣服。好的。保持角色的一致性。这不仅对构造字符有用,而且在您有房间的照片时也有用。嘿,帮助我以五种不同的方式装饰这个房间。好的。也许您会更加保守,因为您非常有创造力。这是您正在做的事情的一种更进步的方式。我已经看到团队中的许多人用它来重新设计他们的花园和房屋。看到这一点真的很棒,就像我们做出的一种实用应用一样。主持人:是的。实际上,我在AI研究中为女友编写了一个带有Amviance代码的申请,并可视化所有不同的颜色他的办公室。百叶窗和窗帘等当时不知道皮尔蒂纳斯的颜色是否会适应这种环境。因此,这实际上是2.0版,必须重试2.5版以验证所有不同的振动。实际上,效果非常好。它非常方便,不是。您也可以使用2.0版。这真的很好,需要进行测试。 2.0版可以更换床并更改其他东西以及窗帘。因此,看到这种使用情况很有趣。这是我最喜欢的用例之一。重复的力量:速度和一致性妮可的魔力:您应该尝试一下。该模型在维护其余一致的场景方面做得很好。这就是完美版。孩子非常重要。好的。因为我只想在图像中编辑该内容。但是您真的希望其他一切保持不变。同样,如果您是在角色的构造中,您只想将角色的角色放置。但是一切在每个场景中,Y使用必须相同,在这方面,该模型都做得很好。这并不总是100%的成功。但是我们对他取得的进步感到非常兴奋。主持人:罗伯特,这是什么意思?罗伯特:是的,我的意思是我认为仍然很快。好的。如你所知。整个一代过程需要多长时间?妮可:让我们吧。这是13秒。主持人:哇。因此,我认为每个图像都是13秒。罗伯特:是的。然后,我认为很棒的是,即使版本2.0发布,我仍然做了与他非常相似的事情。例如,有一个架子。我把一切都放在地上。我说,装饰。例如,这些元素应该放在我的架子上?而且,如您所知,我的女友可能不同意结果。因此,有时您想迭代它。立即跑步并再次迭代。因此,即使它不时失败,您也只需要调整通知并重新执行它即可。之后,您可以获得非常好的结果。所以我Hink这个迭代过程就像在他身后创造魔术一样。主机:例如,测试2.0的人有什么区别?例如,我使用2.0的示例之一就是仅制作一个版本。一次只编辑一个。例如,如果六个不同的事情发生了变化,则该模型可能无法正常工作。其中之一。就像您仍然需要将此模型用于此特定版本,通用性或使用该模型时应该知道的内容一样。 Mostafa:这基本上是我要提及的。因此,交织在一起的魔力之一是为产生图像提供新的范式。好的。如果您有非常复杂的建议,我知道您正在谈论六个不同的版本。当您进行50个不同的版本大约进行时会发生什么?好的。现在,该模型具有一个非常好的机制来获取上下文信息,例如向Pixel Nivel的完整信息,并在下一个回合使用它。您能做的就是要求模型分解申诉前线索。编辑或生成图像,它必须将其分为多个步骤,然后使用不同的步骤一一将其进行编辑。因此,首先,我们制作了这样的版本,例如这五件不同的东西。接下来,接下来的五个,接下来的五个等。因此,这与从语言角度来看的测试和计算非常相似。因此,我们可以花费更多的浮点操作,并且该模型基本上将这个想法带到了像素空间,将其分为较小的部分,实际上,确定和积累了该特定阶段。您可以执行要执行的复杂任务。因此,正如我再次强调的那样,我认为这是受膏的人之间一代的魔力。我认为它可以考虑缓慢生成非常复杂的图像,而不是尝试同时获得最佳图像,例如这种天体方法。好的。最后,以同样的方式,在中间过程中进步的能力是有限的,在某些时候,它将确认100 dEtail。我们不能那样做。但是,将这一代散布并分为多个步骤,总是可以产生其能力和复杂性所需的东西。双子座与图像:如何选择合适的工具主机。我应该始终集中的一件事是,尤其是当您,妮可(Nicole),您也是我们图像模型的项目经理时。人们应该如何看待开发人员或知道所有模型作为形象或我们拥有的本地能力的人们?妮可:是的。如您所知,我们的目标始终是在双子座中建立模型,对吗?因此,我们的最终目标是将所有模式带到双子座,以便我们可以从我之前提到的所有知识转移中受益,并最终推动前进。正是您所需要的东西非常有用,可以在实现其目标的途中进行专门的模型。图像是文本图像生成的绝佳模型。顶点有多种图像变化,也可以使用Speciali制作ZED针对该特定任务的优化图像版。因此,如果您只有文本图像,并且只需要该模型生成的图像,则可能需要获得非常好的视觉质量,并且在生产时间方面非常有利可图和快速。图像是最好的选择。例如,如果要使用模型生成图像,则必须在相同的工作流程中对其进行编辑,并在多个回合中进行工作。或者,如您所知,您想提出一些想法,例如我们使用模型。帮助获得我的房间或这个图书馆的设计思想。然后,双子座是最好的选择。因此,它确实是ESE模式下的创意合作伙伴。您可以广播图像和文字。正如我一开始所说,给双子座的指示将更加精确,因为它们将是纳米卡利亚。因为登录具有理解世界并更具创造性地解释其指示的能力。但是,如果开发人员希望为特定任务过于优化的模型,则图像仍然是一系列模型。主持人:是的S,这是我今天尝试的示例。您如何看待哪种模型,或者本地图像生成模型解决此问题,会生成此问题,然后允许…这是我愚蠢的情况。我说了这一点,并创建了标志使用的案例。您需要一个广告牌。我将以与我提到的相同的方式创建广告牌样式。这是有益于本地图像的产生的东西。因为它在世界上有点好一些,并且与图像相比,它的轨道很好,但是理解我的建议性建议并不是很好。妮可:您的真实意图。是的。所以我认为这是其中的一部分。另一部分是指本地图像的产生。引用您只想获得的样式,如果您想模仿公司的另一种样式,也可以输入模型并将其用作参考。因此,您可以作为参考输入图像。这对于建议很有用,更容易做在双子座中而不是想象中的人。我会那样做。请尝试。是的。你应该告诉我们。您必须将其添加到电子邮件中。主机:如果您使用该标志,我们将通知您。我将向您发送一封电子邮件。我将检查电子邮件。我喜欢它。用户反馈适用于模型演变(2.0-2.5)的演变:返回此主题以及从版本2.0的进度。最有趣的事情之一是,当启动模型时,他们在AI和Gemini应用程序的研究中发表了许多评论。作为模型和所有内容的一般故障模式。我为第一个版本做出了唯一的贡献。这是为了补充,流行的“研究”标签。实际上,您可以重新获得此模型的流行标签,并从另一个模型中消失。例如,您对这个故事怎么说?我收到了许多进度和失败方式的评论,包括2.0版,这并不容易使用。我希望它可以与2.5版一起使用。罗伯特:是的,我的意思是,我们真的坐在X和Twitter等平台上,探索许多评论。我记得Kaushik,我和其他团队聚集并评估了所有障碍。因此,在Twitter,People@我们的真实评论中,有一个参考点,说这不好。例如,如果发布2.0或制作版本,则可以添加编辑,但不一定遵循图像。好的。那就是其中之一,然后我们做了攀登算法,还有更多。这就是为什么我们总是收集评论的原因。主持人:是的,请给我一个无效的例子。是否有一个特别好的例子,它以前无法使用,但是可以轻松完成?我不知道您现在是否有任何想法。通过使用此模型,我认为设备在施工和实施过程中进行了许多操作。我不确定是否有常用案例来证明并确定这是否是一个好模型。 Kaushik:是的,我认为我在颗粒中注意到了什么r当我使用模型2.5时,我曾经认为在模型2.0中很难的一件事是图像之间的一致性,尤其是当存在对象或构建字符并且字符与不同图像一致时。实际上,事实证明这很容易,如果他们在入口图像中,将角色留在了同一位置。例如,模型2.0做得很好。例如,您可以在更改姿势和场景的一般结构时添加帽子,公式更改等。基于该功能2.0版的模型2.5中的另一个特征是,例如,它可以使角色看起来完全像相同的字符,因此您可以从不同角度给出它们,但是例如,您可以收集家具或将它们放置在完全不同的环境中。它不只是粘贴输出图像中的入口图像。主持人:我喜欢我对2.0件事中的一些反应之一。如果图像似乎是HAve添加了一些东西,我在脸上添加了图像。像愚蠢的胡须或帽子一样,它几乎是层次的。这是类似情况吗?它似乎并没有太多导入角色的一致性,但是感觉就像一个类似的问题,只是拿走了内存的像素,主要将它们带到图像而不是LTO Pixels转移。我很好奇这是否是改进的功能。 Kaushik:是的,我认为这主要要归功于真正开发这种模型的真正团队。以前的型号的想法是该版本确实完成了。那只是成功。但是,随着我们开始越来越多地与图像团队合作,您会看到与双子座旁边看到的完全相同的版本,并说这是如此糟糕,为什么该模型会这样做?因此,有一个示例可以融合两个团队的观点。因此,在双子座方面,指示继续,世界知识继续并继续图像。一方面,即时年龄看起来很自然,美丽且真正方便。因此,我认为我需要两者,并且我将共同努力,以便这些团队将其描述为2.5。我喜欢它。妮可:是的,实际上,我们团队中有些人主要是想象力团队。他们具有非常敏锐的美学味道。因此,当我们进行评估时,他们确实查看了数百张图像,并拒绝。该模型比另一个模型更好,团队中的许多人都说看到它很好。我认为这些年来的情况有所改善,因此我必须在几年内完善这种敏感性,但是我认为团队中有些人在这方面确实很好。未来的观点:追逐“智能”和“事实”主持人:您可以培训自动化评估者以评估人们的偏好吗?妮可:目前不可能。主持人:这是剩余项目的有趣业务。妮可:这是一个有趣的业余项目。我真的很想改进双子座。我希望有一种审美理解自动评估。 Mostafa:让它为此提供训练信号。妮可:是的,是的。漂亮的工作。这将用作ASUB后续业余项目。主持人:我喜欢这个。版本2.5有很多进步,但我认为每个人都会很高兴尝试与该模型相关的所有内容。接下来是什么?我们制作了一个很棒的模型。我认为过程中有更多的啤酒详细说明,但是我不知道我希望将来能够实施的未来地址和其他特征我想说多少。 Mostafa:因此,当涉及到图像的产生时,我认为您对视觉质量感兴趣。但是再次,像您一样,您想使用统一的Omni模型要做的是智慧。当用户与他互动时,您想巧妙地感受到图像生成模型。他们不仅给人以图像质量的印象,而且他们还知道它很聪明,您知道,在我的脑海中,我什至无法很好地定义它,所以我希望引起一些争议在那里。当模型要求模型做某事,而不是按照我的说明,而是做某事,而在一代结束时,我说我很高兴我不遵循我的说明。这比我真正解释的要好。然后,它具有此限制。主持人:您认为此模型会故意这样做,还是像非自愿的事故?您想表达这一点吗? Mostafa:不,不,不仅如此,而且基本上,众所周知,众所周知,您知道,或者有时您认为您对现实的事物有错,但是有了双子座的知识,外界从您的角度出发,对您而言是不同的,对吗?再一次,我认为这不是故意的,而只是自然地发生。再说一次,我认为您觉得自己正在与我更聪明的系统进行互动。当请求图像时,如果您偏离我的通知,如果您产生的内容与我所要求的不同,我不在乎。所以,我认为绝对是一个希格h智力水平是我们向前迈进,维持或改善温暖的d的方向,但是,有许多细节,特征和用例,尤其是对于开发人员而言。我认为这次会有一些发行版,但是将会有即将发布的版本,并且这些版本正在准备中。我们不能分享我们的时间表,但是它们非常令人兴奋。是的,我应该,也许是。但是我很兴奋。我很高兴,这种冲动没有之前,例如图像的产生。主持人:我喜欢。您认为存在哪些其他功能?你很兴奋吗?妮可:我对事实感到非常兴奋。您可能应该返回这一点,并为您的工作演示创建小图形或信息图表,对吗?如果您看起来不错,那就太好了,但是对于这种情况来说还不够。确实,必须有必要。您不能具有外部文字。而且我认为我们只对这些模型工具包可以做什么有初步的了解。我们就是这个由于我对用例的类型做得很好,因此我对下一个发行版感到非常兴奋,因此我梦见有一天这些模型可以为工作做出滑动演示。主持人:这是每个产品经理的梦想。妮可:每个产品经理的梦想。我试图将我的工作的一部分外包给双子座。而且我认为我们在这方面发挥了非常重要的作用。主持人:太好了。我喜欢它。好吧,我认为每个人都会很高兴尝试这些模型。多亏了造成这一点的四个团队和其他团队。因此,我感谢所有的努力。我为此感到兴奋。
特殊声明:先前的内容(包括照片和视频(如果有),如有)已由网络自我媒体平台的用户收费和发布。该平台仅提供信息存储服务。
注意:以前的内容(如果您有照片或视频)将由社交媒体平台NetEase Hao的Usaryans收费,仅提供信息存储服务。

此条目发表在吃瓜热门分类目录。将固定链接加入收藏夹。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注