返回列表
亚马逊搜索栏上线AI生成图像功能:通过描述“发明”理想商品辅助搜索
产品发布亚马逊生成式AI视觉搜索

亚马逊搜索栏上线AI生成图像功能:通过描述“发明”理想商品辅助搜索

亚马逊近日对其移动端应用搜索栏进行了重大更新,引入了生成式AI图像技术。该功能允许用户通过文字描述实时生成虚拟产品图像,目前主要应用于服装和家居用品领域。用户可以点击这些AI生成的“理想商品”图像,进而在亚马逊平台上搜索并匹配与之视觉风格相似的真实在售商品。这一创新旨在解决用户难以用准确关键词描述心仪产品时的搜索痛点。

The Verge

核心要点

  • 实时AI绘图:亚马逊搜索栏现在可以根据用户的文字描述,即时生成符合要求的虚拟产品图像。
  • 品类覆盖:该功能目前处于初期阶段,主要针对服装(Clothing)和家居用品(Home Goods)两大类别开放。
  • 视觉参考机制:生成的图像并非真实存在的商品,而是作为视觉锚点,帮助用户寻找平台内最接近的实物。
  • 优化搜索路径:旨在提升用户在面对复杂设计或特定审美需求时的搜索效率和准确度。

详细分析

搜索交互从“关键词”向“视觉化”的跃迁

传统的电商搜索高度依赖于关键词的匹配,但用户在寻找具有特定设计感的服装或家居饰品时,往往难以用精准的词汇来描述其脑海中的构思。亚马逊此次推出的AI生成功能,实质上是将搜索过程从“文字检索”进化到了“视觉确认”。通过AI技术,系统能够理解用户的描述性语言并将其具象化为图像。这种方式允许用户先在屏幕上看到一个“理想模型”,即便这个模型在现实中尚未生产,它也能作为一个完美的视觉过滤器,帮助用户在海量库存中快速锁定风格最接近的真实商品。

聚焦高视觉敏感度品类的战略布局

亚马逊选择将服装和家居用品作为该功能的首发阵地,具有极强的针对性。这两个品类具有极高的视觉敏感度和主观审美偏好。例如,用户可能想要一件“带有复古波点元素且剪裁独特的夏日长裙”,或者一个“具有极简主义风格且带有金属拉丝质感的台灯”。通过AI生成的虚拟图像,用户可以直观地判断AI是否理解了自己的意图。一旦用户点击了最符合心意的AI图像,亚马逊的推荐算法就会介入,展示与其视觉特征高度一致的在售商品。这种“所见即所得”的搜索逻辑,极大地缩短了用户的决策链路。

行业影响

亚马逊的这一举措标志着生成式AI在电商领域的应用进入了深水区。这不仅仅是一个有趣的小工具,更是对传统电商交互逻辑的重塑。首先,它展示了生成式AI如何解决“表达鸿沟”问题,让非专业用户也能通过自然语言精准调动复杂的搜索算法。其次,对于电商行业而言,这种视觉搜索的进化可能会改变流量分配的逻辑,使得那些具有独特设计感但关键词权重不高的商品更容易被发现。最后,这也预示着未来电商平台可能演变为一个“创意协作平台”,AI不仅帮助用户找东西,甚至可能在未来根据用户的生成需求,反向推动定制化生产的实现。

常见问题

问题 1:我可以直接购买AI生成的这些图像中的产品吗?

目前不可以。这些图像是由AI根据您的描述实时生成的虚拟模型,旨在作为视觉参考。它们的作用是帮助您在亚马逊现有的库存中,找到与这些虚拟图像在外观、风格或设计上最相似的真实商品。

问题 2:为什么目前只能在服装和家居用品中使用这个功能?

服装和家居用品是视觉属性最强的品类,用户往往有明确的视觉需求但缺乏准确的描述词汇。亚马逊目前在这些领域先行试点,可能是为了测试算法的准确性以及用户的接受度。未来该功能是否会扩展到其他品类,尚需观察官方的进一步更新。

问题 3:这个功能是在网页端还是移动端使用?

根据目前的信息,该功能主要作为亚马逊App(移动端应用)内的更新推出,旨在优化用户在移动设备上的交互体验。

相关新闻

Google推出Dreambeans:利用个人数据生成AI插画故事的全新工具
产品发布

Google推出Dreambeans:利用个人数据生成AI插画故事的全新工具

Google近日推出了一款名为“Dreambeans”的AI工具,该工具能够通过提取用户Google账户中的个人数据,将其转化为一系列由AI生成的插画“故事”。这款工具被媒体称为Google迄今为止命名最奇特的AI产品,旨在将用户的数字化生活足迹以卡通化的艺术形式重新呈现。

Google 发布 Gemma 4 12B:首款无编码器统一多模态模型,支持笔记本本地运行
产品发布

Google 发布 Gemma 4 12B:首款无编码器统一多模态模型,支持笔记本本地运行

Google DeepMind 正式推出 Gemma 4 12B 模型,这是一款采用创新“无编码器”架构的中型多模态模型。它填补了边缘端 E4B 与高性能 26B MoE 模型之间的空白,首次在 12B 规模实现原生音频输入。该模型具备接近 26B 模型的推理能力,支持复杂的代理工作流,且能在 16GB 显存的笔记本电脑上流畅运行。目前,Gemma 4 12B 已通过 Apache 2.0 协议开源,旨在进一步推动端侧多模态 AI 的普及。

微软发布MAI-Code-1-Flash:专为GitHub Copilot打造的高效编程大模型
产品发布

微软发布MAI-Code-1-Flash:专为GitHub Copilot打造的高效编程大模型

微软Superintelligence团队正式推出MAI-Code-1-Flash编程模型。该模型由微软端到端构建,采用合规授权数据训练,旨在为开发者提供快速、高效的代码辅助。目前已面向VS Code中的GitHub Copilot个人用户开放,具备代理化编程能力、自适应思考及强大的指令遵循能力,标志着AI辅助编程向更高效、更智能的方向迈进。