过去一年,字节推出十余款AI应用,覆盖Agent 定制、聊天、社交、图像、视频、办公、教育等多个领域,甚至还涉足了硬件产品。
移动互联网时代,字节就有「APP工厂」之称,所以相继打造今日头条和抖音两个爆款产品,借此成为最赚钱的中国互联网公司之一。
大模型时代,他们还要创造新的增长奇迹,寻找第三个超级应用的可能性。
这不是字节的专利。置身于AIGC浪潮之年,发力大模型的公司都是这样设想、计划且实施的。
在今年5月的一场行业大会上,小冰公司CEO李笛提到,「当前 AI 的商业价值已从单纯的技术输出转变为通过高附加值产品实现收益。」
更早些时候,朱啸虎在接受腾讯新闻的采访时也很现实地谈到,对于AGI(通用人工智能),他信仰能马上商业化的应用。但对于大模型到底在什么点让to C应用爆发,他也不知道。他只是说,「to C应用必须刚需、高频,长远才有机会守得住。」
如同争夺移动互联网的船票一样,现在大家瞄准的是AI时代的船票。字节当然也知道,现在是押宝的阶段,所以探索型布局显得尤为重要。
字节需要AI时代的抖音
过去一年,Chatbot、AI虚拟社交、AI Agent是AI圈热点讨论的三大产品领域,字节无一遗漏。
除了对标ChatGPT、Kimi的智能对话产品豆包;定位为「AI虚拟角色聊天互动社交」星野的「猫箱」(原「话炉」);还有AI Bot开发平台扣子(Coze),对标OpenAI推出的GPT Store。
这是由多支AI团队内部赛马的结果。短时间快速推出产品,再经由市场检验,优胜劣汰,这是字节一贯的作风。移动互联网时代,字节就有「App 工厂」之称。《晚点 LatePost》曾统计,2018-2020 年,字节跳动自研/收购了大量项目,在App Store上线的应用约140 个。
其中不论在字节体系内,还是AI行业,豆包都以用户规模第一的姿态处于探索前锋。
而且豆包承载着字节在AI时代的雄心——即打造类似今日头条、抖音这样的爆款、国民级应用。
简而言之,豆包是一款通用型产品,既是生产力变革工具,也有情感陪护功能。甚至应用与大模型同名,都是豆包。
所以,基于豆包大模型(原云雀大模型)开发的 AI bot,豆包可以实现AI智能聊天、对话、问答工具,预制了多个智能体,支持学习、生活、情感等多个场景,同时也允许用户定制自己的AI智能体。
QuestMobile数据显示,截止到今年7月份,AI原生应用(也即APP)月活用户规模已经突破了6630万,其中,豆包以3042万的月活用户规模位居榜一,比百度的文小言多出2000多万的月活用户规模。
这是字节信奉大力出奇迹的结果。在抖音,看不到什么AI应用的投放广告,除了豆包。据说,字节几乎屏蔽了同类型产品在抖音的所有投放,将海量用户转化的机会都留给了自家豆包。
除豆包、星野等AI原生应用外,字节根据自身业务特性,甚至战略需要,基于现有产品孵化中一些新的应用,最典型的就是即梦。
作为全球短视频最大平台,字节CEO梁汝波曾在内部发起警觉,「AI技术对于内容创作会有很大的颠覆,甚至会产生新的创作平台」。尤其Sora横空出世之后,文生视频的风浪可能会进一步冲击抖音现有的行业地位。
假如,中国版Sora不是出自字节系,而是其他创作平台呢?并且这样的事情一而再再而三的发生呢?后果是,抖音就会失去视频创作入口。久而久之,更是可能失去发布入口。
这是张楠被调任剪映的一个重要背景,即梦正是她掌管的剪映业务团队推出的一个AI视频生成应用。
但是从反馈来看,这个新产品距离被用户广泛接受,还有很长距离要走。截至今年10月15日,七麦数据显示,即梦AI的累计下载量为79.14万。此外,这款产品近30天日均下载量为22978次。
从时间表来看,即梦的雏形Dreamina比快手可灵推出时间要更早,却被后者赚足风头。一个未经证实的消息是,可灵的营收已经过千万,内部还切蛋糕小小庆祝了一下。大模型时代,视频行业格局发生变数的可能性增加了。
左手豆包,右手剪映,这是字节在大模型时代迅速打出的两张王牌。一个是纯粹的AI原生应用,一个是基于现有核心业务的进化迭代,本质都是在争取AI时代的一张船票。
APP工厂依然在继续
豆包和即梦只是字节押注AI应用的两个明星产品。这个移动时代的APP工厂,依然在广泛布局。
而且他们是全产业链推进。从底层最基础的模型层,到中间做性能优化匹配的连接层,再到最后落地C端的应用层,字节跳动都全面涉及覆盖。
据新莓daybreak不完全统计,去年 8 月至今,字节跳动在 AI 领域一共推出包括豆包大模型家族在内的 9款大模型、2 个智能体开发平台,和十余个 AI 应用。9月份,字节甚至推出首款AI硬件产品——AI智能体耳机Ola Friend,试图在硬件市场找到AI落地的新入口。
根据非凡资本旗下商业数字化及创新研究中心「非凡产研」的数据榜单显示,除了百度,字节是国内目前AI产品数量最多的企业。
对比两家大厂,百度AI产品的布局策略是从覆盖热门品类,到赋能日常衣食住行场景。比如AI对话产品文心一言,以及接入百度人脸识别技术的中关村在线科技生活馆、整合百度AI技术,为景区搭建智能票务系统等。
字节则更多集中聚焦市场热门领域中的高频使用场景品类。比如图片/视频生成、聊天、社交、办公、教育、音乐等领域。
据新莓daybreak不完全统计,今年年初以来,字节更新或上线了扣子、猫箱、星绘、河马爱学等8款AI应用产品,且大多都在今年上半年推出。
值得注意的是,这些孵化更新的产品并不仅产生于一个团队,除了聚焦于应用层的AI创新业务部门Flow,剪映、今日头条、大力教育、巨量引擎等业务部门也在发力AI,这些团队目前推出的产品分别聚焦于图像/视频、办公、教育、电商内容创作等领域。
此外,字节AI产品策略还有一个典型特征,就如移动互联网时代那样,更注重海内外同步布局。国内有豆包,海外有cici;国内是扣子,海外是Coze;国内推出猫箱,海外就有BagelBelI……
其中,字节跳动旗下海外产品Gauth、Cici AI、Hypic三款应用均进入2024年9月的全球APP下载榜Top30。
而且字节试图C端和B端通吃。典型如既面向C端又面向B端开发者的Agent定制产品「扣子」。
除了大模型,Agent(智能体)是另一个被广泛讨论的概念,业内共同的认知是:「Al agent是AI与具体应用场景结合落地的一种方式,大模型需要Agent来实现功能的扩展。」
「扣子」是目前Agent应用开发平台领域用户规模最高,品牌热度最大的产品。根据第三方平台Similarweb的数据,截至2024年6月,「扣子」的月访问用户数达到约200万左右。
上线初期,一位知乎用户分享自己使用扣子的实际体验,「基于文本的对话体验挺好,速度反应比原生GPT4速度快,流畅。也支持部署到discord上当Agent使用。但是多模态挺bug的,上传的文本和图像基本存在问题,完全不能用。」
尽管问题重重,依然没有阻挡大厂推出Agent开发平台的热情。
百度智能云千帆APPBuilder于2023年10月17日推出,是上线时间最早的产品,百度今年二季度财报数据显示,App Builder构建应用量达数十万。腾讯元器于今年5月上线,但目前并未公布用户规模,不过用户创建的智能体可以一键分发至QQ、微信客服、微信公众号等腾讯全域。
核心领域都要覆盖,国内海外同步,C端B端通吃,字节产品布局策略有效的前提是,大模型底座足够过硬。
大模型底座够不够支撑字节的野心?
字节在忙着布局应用的同时,豆包大模型也在快速更新。
2023年8月,字节自研推出了一款大规模预训练语言模型——云雀大模型,定位于自然语言内容生成和内容理解的AI大模型。豆包就是基于该模型开发出来的。7个月之后,云雀大模型升级为豆包大模型家族,并一口气发布了9个豆包模型。
字节大模型差不多是每两个月更新一次。今年5月,字节火山引擎先是一口气推出9款豆包大模型家族,两个月之后又发布了豆包·图生图模型;再到今年9月,推出了PixelDance和 Seaweed两款豆包·视频生成模型。
截至目前,豆包模型家族已经集齐了文本、语音、图片、音乐、视频等,共计13款模型。
今年5月,火山引擎总裁谭待接受虎嗅采访时提到,字节的模型在不断进化,一旦进化到某一个层次,就有可能去上面做应用。字节的两款TOP级AI原生应用——扣子和豆包,都是基于豆包大模型。
并且谭待还提到字节对外发布豆包大模型相对较晚的原因,「因为豆包到了大家可以广泛用它去做应用的程度,只有越来越多的人去做更多应用,反过来又可以驱动技术进步,形成一个正循环。」
最近,硅星人引用字节内部人士的话解释豆包大模型,「现在的豆包更像是一个统一的出口,连接用户。豆包产品后端连接了多个模型测试,是一个训练场,通过API的结果反馈来评测模型效果,但一时间很难有取舍。」
此外,定位为字节跳动的 ToB 云平台「火山引擎」,肩负着字节在B端市场数字化落地的大任。随着AI大模型的出现,「云服务+大模型」就成了云服务市场转型的重点。
目前,火山引擎已经形成云基础设施、豆包大模型和火山方舟2.0的一套产品体系。一方面可以帮助企业实现AI转型,一方面为内部输血。
比如上月底发布的豆包视频生成模型,在训练过程中就采用了火山引擎的大模型训练视频预处理方案。而火山引擎视频云团队提供的点播解决方案,也保障模型完成商业化应用。
在字节内部,火山引擎给自己的定位是「为他人做嫁衣」。去年,谭待对外表示,「火山引擎自己不做大模型,首先服务好国内做大模型创业的公司。」
当时,他对媒体强调,火山的任务一方面是算力供给,另一方面是搭建云原生机器学习平台,帮助企业应用好算力,进一步提升效率,把大模型训练得又快又稳定。
置身于AI大模型应用的浪潮年。在完成商业落地的同时,业内奋起争当「中国OpenAI」,底层能力的搭建至关重要。
上个月,谭待在解释为何此时才发布视频模型时提到,模型是影响未来十年、二十年的长远的东西。
AI计算正在加速渗入各行各业,一场看不见的革命也许就在不久的未来。但同时,字节在AI时代的野心也需要得到物理世界的验证。
而种一棵树,最好的时机首先是在十年前,其次是当下。