相比于大厂热衷布局的 AI 社交、AI 视频、AI 音乐等热门赛道不同,此次支付宝通过推出“探一下”,则切入了一条全新的生成式 AI 视觉搜索赛道。

Tech 星球体验发现,“探一下”是基于蚂蚁百灵多模态大模型技术的 AI 产品,相比于传统的视觉识别产品,“探一下”可以提供更快速、有用、趣味的生成式搜索服务。

用户在支付宝首页点击 “扫一扫” 后往左划,即可找到 “探一下”的入口,在支小宝 App 也能快速访问。进入“探一下”的主界面后,只需定格摄像头所捕捉的画面,系统便会开始分析并生成结果。

不同于以往的扫五福等玩法,运用的都只是图片识别技术。支付宝上线的“探一下”,除了融合原有的 AR 扫之外,还有三个特色核心功能——探知识、探灵感、探文本,兼具实用性和趣味性。

“探知识”是对内容进行识别,在捕捉画面主体后主动生成识别结果,并基于此进行发散性的信息智能推荐。

探知识的使用场景并不少,在生活、旅行、学习、购物等场景中,都有着很大需求。譬如,用户在购买手机时,不仅可以通过 “探知识” 直观地看到手机的配置信息、设计灵感等知识,还可以通过其附带的“探商品”入口,跳转至商品界面,完成从了解手机到购买手机的链路。

“探文本”也是基础的通用功能,可用于文本提取和翻译。譬如,对于跨境游客、跨境商家和海淘买家大有作用,遇到外文菜单或商品详情页,就可以快速提取关键信息并翻译。

除此之外,“探一下”还有“探灵感”的功能,Tech 星球发现,在小红书内,“探灵感”成为了不少用户讨论最多的一个功能。

一位用户直言,“探灵感”让内容有了生命。从 AI 的视角看,这种生命感,源自“探灵感”让内容被 AI 赋予了特别的视角滤镜。譬如,可用幽默或治愈的视角,对静态图片进行趣味解读,让你在网上晒图再也不愁写啥文案。

“探一下”是一款具有创新性和实用性的生成式 AI 视觉搜索产品。不过,从目前的使用体验来看,也还有待完善的地方,例如,会受到光线、角度、距离等实际场景因素的影响,导致识别结果不准确或出现错误。

从“搜”到“探”,引领下一代 AI 视觉搜索

搜索诞生 20 年,一直致力于帮助用户更平等地获取信息。

传统搜索一直在进化,信息输入方式从手动打字到语音唤醒、图片识别,但始终未能焕新呈现结果。在 Make 2024 钉钉生态大会上,钉钉 COO 傅徐军在接受媒体采访时还谈及了传统搜索引擎难用的更多原因。他表示,传统的搜索检索到的大量信息是碎片化、离散化、非结构化的。

这背后折射出的是传统搜索模式基于关键词匹配的低效,较难精准理解用户的真实意图,仅仅是机械罗列可能相关的内容。而用户得到想要的内容,还需要在搜索到的内容中进行二次甚至多次检索。

生成式 AI 技术让搜索有了革新的可能。不少企业正在尝试革新搜索,比如搜索鼻祖 Google 旗下的视觉搜索产品 Google Lens。

Google Lens 近年来不断拓展功能边界,比如增加视频搜索与语音输入等形式,然而其核心依然是围绕传统搜索以“搜”为主的理念的修补,比如 Google Lens 生成的内容必须链接到 Google 自己的搜索结果,但是 Google 自己的结果跟内容生态并不是为视觉入口去设计的,很多还是基于文本的一个入口;国内的识别类 AI 则专注于花草等识别,却也只是在细分领域深耕细作,未能投入大规模应用。

在支付宝探一下业务负责人蔡伟看来:未来的搜索有两大发展趋势,第一个趋势就是从搜索到生成;第二个趋势是从文本主导的交互走向多模态交互。

技术极客们的终极目标,正是希望用户一次就可以得到满意的答案和服务。这是探一下和其他搜索工具的核心区别。

探一下通过视觉大模型的识别和思考后,基于生成式 AI 技术给出系统性的答案,而不是碎片化的信息。这不仅是简单的技术升级,实际上背后是一种全新的交互逻辑。

以潮玩识别为例,传统搜索可能只是敷衍地给出基本信息,“扫” 模式也仅是略知一二,而 “探一下” 则将被动搜索转变为智能推荐,能深挖其收藏价值、市场动态及同系列产品的前世今生,这种深度挖掘能力源于其先进的算法架构和海量数据的精准训练,使其在知识理解与关联拓展上更进一步。

同时,“探灵感” 像是创意的源泉,为图片量身定制趣味盎然的文案,开启用户与 AI 携手创作的大门,这也是以“搜”为主导的搜索时代无法完成的功能,因为它能从有用信息迈向有趣内容 ,给用户独特的情绪价值。

搜索引擎的核心始终是如何正确理解并回答用户的提问。在生成式 AI 技术的加持下,“探一下” 正探索一种全新的视觉交互方式和入口。它有眼睛能探索万物,也像人脑一样思考,想要一步到位给出用户最全的知识图谱,让用户的搜索体验得以变革性提升。

积厚成势,AI 焕新蚂蚁

20 年前,中国开通国际 64K Internet 信道,标志着中国正式全功能接入了国际互联网,并且诞生了一批传奇性互联网企业。如今,随着技术红利见顶,互联网市场饱和,对于蚂蚁这样的互联网公司而言,急需探索新的技术点、挖掘新的盈利点,寻求破局关键。

AI 技术,或许能成为网络宽带一样的使能技术,催生新的商业形态。

从战略规划层面看,蚂蚁集团确立“ AI First ”方针,这是基于自身大规模业务场景需求所做出的决策。蚂蚁集团着手布局多项 AI 前沿技术,涵盖大模型、知识图谱、运筹优化、图学习以及可信 AI 等领域,构建起自身技术体系。

在 2024 外滩大会上,蚂蚁集团集中一口气推出多项成果:发布 AI 生活管家 App “支小宝”,聚焦日常生活服务;升级 AI 金融管家 “蚂小财”,主打金融专业智能服务;推出面向医疗及泛健康行业的“ AI 健康管家”,开拓健康领域智能化应用。

蚂蚁集团启动支付宝智能体生态开放计划,上线智能体开发平台“百宝箱”,吸引外部开发者参与,丰富生态多样性。

蚂蚁以百灵大模型为核心驱动力,为各应用赋予多模态理解与生成等能力,推动产品稳定运行与焕新。如 2024 年支付宝五福节,百灵大模型服务近 6 亿人次,让大众通过 AI 互动玩法感受新年氛围。

蚂蚁 AI 发展路径也不止于内部研发,还通过投资与合作拓展边界。2024 年,其投资与成立多家 AI 相关企业,比如 12 月在上海成立 “上海蚂蚁灵波科技有限公司”,聚焦具身智能领域;8 月领投秘塔科技超 1 亿元新一轮融资,推动 AI 搜索技术发展。

支付宝在垂直行业持续泛化 AI 能力,如针对政务场景打造了政务 AI 解决方案,推动民生服务分发效率提高 50%,发挥了 AI 在实际场景中的作用。

大模型的竞技是一场关于技术、资金、人才的比拼。AI 能否开启蚂蚁集团诸多新业务大门,助力蚂蚁集团塑造新形态,实现新一轮成长蜕变,值得期待。

欢迎按指引星标 Tech 星球

第一时间接收文章更新