云计算·大数据 频道

当合规成为“生命线”,HOLLA Group借亚马逊云科技实现违规内容的AI审核

  从最早的飞鸿传书,到后来的BBS(网络论坛)、博客、SNS(微博、微信、短视频、直播)……信息技术的每一次迭代,都在不断拓展人类的社交半径,重新定义连接方式。如今,跨越时空与媒介的隔阂,与同频的人随时随地来一场心灵对话,已不再是梦想。

  但是,你知道吗?在全球数字化社交浪潮中,有一个特别的现象正在欧美悄然兴起——“随机匹配视频聊天” 正成为00后Z时代的“新宠”,催生出一批现象级社交应用。

  其中,成立于2016年的全球社交娱乐公司HOLLA Group,正是这股浪潮中的弄潮儿。十年间,这家中国出海企业不仅见证了全球视频社交的崛起,更以技术创新和合规先行的理念,在不同国家和地区构建起一个安全、有趣的社交平台,成为全球年轻人跨越文化边界、寻找同频伙伴的重要桥梁。

  合规“突围战”

  HOLLA Group的应用体量到底有多大?一组数据可以说明一切:全球累计注册用户2.3亿,覆盖190多个国家和地区,月活跃用户目前近 2000 万,每天视频匹配量超过3000万次,不到5秒就能匹配成功……

  更值得关注的是,HOLLA Group旗下不是只有一款产品,除了HOLLA,还有Monkey、Hay等多款社交应用。以Monkey为例,拥有数千万粉丝的全球第二大网红IShowSpeed(国内称“甲亢哥”),就非常喜欢用Monkey,常在 YouTube 分享自己使用 Monkey的直播及精彩剪辑。

  这么大的流量,如果全靠人工盯内容审核,工作量简直大到不可想象。如果只用传统AI,能识别的场景又太有限。更何况,不同国家的法律、文化、语言,让审核变成了横在全球化路上的“一座大山”。

  问题是,HOLLA Group为什么一定要重视内容审核?

  “如今,各个国家和地区对社交产品的合规要求越来越明确、越来越严格,尤其是在未成年人保护和数据合规方面,相关法规也在持续强化。对社交媒体行业而言,安全合规已经从‘可选项’变成了‘生命线’。” HOLLA Group CTO 张玉智表示。

  ▲HOLLA Group CTO 张玉智

  随着欧美及亚太地区数据隐私保护(如GDPR、COPPA)和本地化存储相关法律法规的不断收紧,企业需要持续适应并满足不同地区的合规要求,这是最大挑战。

  此外,伴随用户规模的快速增长,HOLLA Group还面临着底层基础设施和差异化技术能力提升问题。

  HOLLA Group用户分布在欧美、亚洲、中东等不同国家和地区,网络质量差异会导致视频延迟或卡顿,影响用户体验,其底层基础设施也需要具备足够的弹性以支撑用户数量的激增。

  另外,在竞争激烈、产品同质化的环境中,企业需要应用AI技术,打造诸如AI翻译、智能匹配、实时审核、AI标签等技术能力,同时需要持续优化产品体验与安全治理,从而提升用户留存和使用粘性,构建差异化竞争优势。

  AI审核从“人海战术”走向“智能天网”

  为了让用户即时、真实、安全地进行跨地域社交互动。HOLLA Group不得不采用技术手段,实现从“事后处理”到“事前预防”的革命性突破。

  经过综合评估,公司选择与亚马逊云科技合作,打造了一套“三位一体”(传统模型训练+大模型泛识别+本地/云端/产品策略)的AI识别审核解决方案。

  “过去主要依靠人工经验去覆盖场景,但传统模型的能力有限。如今,我们构建了更长的审核链路,借助大模型补足了传统审核难以覆盖的内容,这也使得我们的AI违规内容识别拦截率从95%提升到了现在的99.7%。” HOLLA Group业务中台VP王广威透露了一个事实。

  ▲HOLLA Group业务中台VP王广威

  可别小看这4.7个百分点的提升,对于每天数千万次匹配的社交平台,这个数字意味着无数用户能免于接触不良信息,也意味着平台不会遭遇“下架”风险。

  至于,这套方案到底是怎么做到的?需要从传统模型应用开始说起!过去,HOLLA Group主要依靠传统小模型做单场景识别,这种做法速度快、时延低,但能覆盖的场景有限。比如:聊天审核,只要没有敏感词,它就放过。但问题来了——如果一个人用“隐晦”的语言暗示违规内容,或者用整段对话实施情感欺诈,传统模型根本看不懂。

  后来,HOLLA Group引入了Amazon Nova多模态大模型。Amazon Nova能够把图片、视频、语音、文本等多模态信息放在一起,结合上下文做到更全面的识别。比如:在聊天审核中,即使没有敏感词,Amazon Nova也能识别出上下文里潜在的风险。

  具体而言,HOLLA Group构建的这条“长审核链路”主要包括三大部分:

  1、传统模型训练能力(自研AI模型T-Hunter):结合专门训练的模型提升特定场景的准确率,负责高频、低延迟的单一场景识别,包括图像、文本、视频的精准分类与检测,如涉黄、涉暴、未成年人内容识别毫秒级反馈;

  2、大模型泛识别能力(Amazon Bedrock、Amazon Nova):利用AI的强大的识别能力,处理复杂场景,支持多语言、多文化环境下的动态规则匹配和合规审查,补足传统模型遗漏的不足;

  3、本地+云端+产品策略:作为最后一道防线,每天只需处理几十条疑难杂症,成本降到极低。

  HOLLA Group 应用Amazon Bedrock作为其AI技术的核心平台,同时借助Amazon Nova进行图像识别与内容审核,能够对Monkey等社交平台上的实时视频、语音和文本进行低成本、高精度的自动检测,识别不当或违规内容并及时打标,并且支持多语言、多文化环境下的动态规则匹配。

  目前,识别内容已覆盖用户头像识别、图像打标、视频违规识别等典型业务场景。其系统检测与打标的覆盖率从80%提升至95%,图片性别鉴别准确率从80%提升至91%。相较于传统审核方式,效率提升近20%,成本降低约40%,合规审查覆盖100%主流语种。

  不止审核,AI翻译、智能匹配、用户标签…AI正在创造“更多可能”

  AI的价值不只在“守住底线”,还在创造“更多可能”。举例来说,HOLLA Group用Amazon Bedrock + Amazon Nova,把AI用在了如下场景:

  1. 智能匹配与用户标签

  以前给用户打标签靠人工打标,又慢又不准。现在借助Amazon Nova识别用户头像的五官,自动生成统一的五官分类标签,再结合兴趣爱好和文化背景做智能推荐。匹配的精准度上来了,用户留存自然就高了。此外,每天超3000万次匹配,不到5秒就配对成功,靠的是底层从计算、存储、数据库到AI服务的完整技术栈,提供的完整服务。运维团队只有个位数工作人员,却支撑着2亿用户的全天候使用,这就是云原生的力量。

  2. AI翻译与实时字幕

  190多个国家和地区的用户在一起聊天,语言不通怎么办?HOLLA Group基于Amazon Bedrock和Amazon Nova,提供了实时语音翻译和字幕。你说中文,对方看到的是英文;对方回西班牙语,你看到的是中文。这种“无障碍社交”直接拉高了付费转化率。

  事实上,HOLLA Group从初创至今,所有业务都“长”在亚马逊云科技上。可以说,没有亚马逊云科技稳定且与时俱进的技术和服务,就没有企业今天的高速发展。

  为什么选Amazon Nova?五分之一的成本账!

  面对AI浪潮,HOLLA Group 与亚马逊云科技迈入全新合作阶段。至于,企业在大模型选型中,为什么一定要选择Amazon Nova?

  张玉智算了一笔账:一个竞品模型审图百万Token花费0.3美元,而Amazon Nova Lite版仅需0.06美元,是前者的五分之一。识别一张400x300分辨率的图片,1美元可处理近1万张,竞品只能处理2000张左右。

  当然,价格不是唯一考量标准!“我们同时把一批图片交给多个模型审核,Amazon Nova在泛识别、室内外场景判别等方面,通过提示词调优有效消除了幻觉,质量与竞品并无明显差别。对于模型不确定的极少数情况,转人工审核即可。” 张玉智说。

  他还透露了一个“鸡生蛋”的妙用,那就是用大模型来蒸馏和训练自己的传统模型。过去训练一个垂直识别模型需要数月、投入数百万甚至上千万美元;现在利用大模型生成标注数据,再在Amazon SageMaker上快速训练,成本和时间都压缩了一个数量级。

  结语

  当100%的负载都托付给一家云厂商,当AI拦截率逼近100%……HOLLA Group的故事,其实讲述的是一个关于“信任”的话题。用户信任平台的安全,才愿意敞开心扉与世界交流;平台信任亚马逊云科技的技术,才能以极低成本、极高效率守护全球数亿用户的每一次连接。

  展望未来,HOLLA Group将与亚马逊云科技共同引入Agentic AI技术,构建 “智能化一体审核平台”。这个平台会以Agent的方式,把多种审核场景纳入统一管控流程。同时,他们将高度依赖无服务器架构(Amazon Lambda),让运维成本保持极低状态。

0
相关文章