定义
MUM(Multitask Unified Model)是Google在2021年I/O大会上发布的AI模型,是比BERT更强大的多语言、多任务统一模型。MUM使用T5X架构,能够同时理解和生成多种语言、多种任务的内容。Google表示MUM是”搜索的未来”,将重新定义用户与搜索引擎的交互方式。与BERT的单向理解不同,MUM能够跨语言、跨模态地理解和综合信息。目前MUM已在Google Lens和部分搜索功能中开始应用,其全面应用预计将显著改变搜索体验。
背景
MUM的诞生源于Google对现有AI模型局限性的突破需求。BERT只能处理单一语言、单一任务,而用户的真实需求往往是多语言、多任务、多媒体的综合。例如,一个用户可能在英文但搜索中文内容,或者需要综合文字、图片、视频等多种形式的信息。Google搜索团队认为未来的搜索应该是”无障碍的、多形式的、多语言的”,这需要更强大的AI模型。MUM就在这一背景下诞生,它在100多个语言上进行了预训练,理解和生成能力远超之前的模型。
原理
MUM的技术架构包含三个核心创新。
首先是统一多任务学习框架,MUM能够同时处理翻译、问答、信息提取、内容生成等任务,而非针对每个任务单独训练模型。
其次是跨语言理解能力,MUM在100多个语言上预训练,能够理解语言之间的深层语义关系,实现真正的跨语言搜索。
最后是跨模态理解能力,MUM能够同时理解文本、图像、视频,未来搜索将不再局限于文字输入。
具体参数上,MUM是约数十亿参数的大模型,运行成本显著高于BERT,因此Google仅在小范围场景中首先应用。
应用
MUM对当前搜索体验的影响主要在三个方面。
首先,跨语言搜索效果显著提升。用户可以用一种语言提问,获取其他语言内容的答案,这消除了语言障碍。
其次,多模态搜索开始普及。用户可以结合图片、文字、语音进行搜索,Google能够综合理解多种输入形式。
最后,个性化搜索能力增强。MUM能够理解用户的搜索历史和偏好,提供更个性化的搜索结果。
案例
案例一:跨语言旅游搜索。用户在英文搜索”日本最好吃的拉面”,Google返回了中文、日文、英文的精选内容,这是MUM跨语言能力的表现。该功能使国际旅游相关内容的多语言搜索曝光提升了约60%。
案例二:多模态产品搜索。用户拍摄一张运动鞋照片并搜索”这双鞋适合跑步吗”,Google综合理解图像和文字后返回了专业建议。这是Google Lens与MUM结合的早期应用,该功能使电商的产品相关搜索转化率提升了35%。
误区
SEO从业者对MUM存在三大典型误区。
第一,认为MUM已经完全普及,实际上MUM仍处于小范围应用阶段,全面上线需要时间。
第二,认为需要为MUM做特殊优化,实际上高质量的多语言内容、多媒体报道自然会被MUM推荐。
第三,认为英语内容不再重要,实际上MUM支持多语言,但英语仍是最大的训练语料,英语高质量内容仍具有优势。
互联在线CTO点评
MUM代表了Google搜索AI化的未来方向。我的建议是:首先,不要等待MUM全面上线才做准备,高质量内容、多语言覆盖、多媒体内容现在开始就要重视;其次,跨语言内容策略变得更重要,考虑内容的多语言版本;最后,持续关注Google产品更新,MUM的功能正逐步集成到现有产品中。
