前Meta研究人员为Memories.ai筹集800万美元,旨在构建能理解长视频的AI

作者
Tomorrow Capital
9 分钟阅读

记忆革命:Memories.ai 800万美元种子轮融资如何重塑视频智能的未来

在一个被视频数据淹没的世界里,一支由前Meta研究人员组成的小团队认为他们已经解决了人工智能最顽固的局限之一:无法真正理解长篇视频内容。他们的解决方案可能会重塑从安全到娱乐的各个行业,同时在AI基础设施领域开辟新的投资前沿。

机器视觉被遗忘的维度

Memories.ai 由前Meta Reality Labs研究员肖恩·沈博士(Dr. Shawn Shen)和周恩民(Enmin Zhou)创立,于2025年7月24日宣布结束秘密开发阶段,并获得800万美元种子轮融资。本轮融资由Susa Ventures领投,Samsung Next、Fusion Fund、Crane Venture Partners、Seedcamp和Creator Ventures参投。

这家初创公司开发了一种他们称之为“大规模视觉记忆模型”(Large Visual Memory Model, LVMM)的技术,旨在克服当前AI系统难以处理数小时以上视频内容的局限性。据该公司称,他们的技术可以扩展到分析多达1000万小时的视频——这远远超出了行业现有能力。

这轮融资——达到公司最初目标的两倍——由Susa Ventures领投,Samsung Next、Fusion Fund、Crane Venture Partners、Seedcamp和Creator Ventures参投。

数字记忆:隐藏在视线中的千亿美元问题

Memories.ai 解决的这一局限性代表着多个行业普遍存在的巨大低效率。尽管基于文本的人工智能已经出现了能够处理数十万个令牌的模型,但视频分析通常在几分钟的内容后就会失效。

“企业拥有PB级的视频数据,但无法有效搜索或分析,”一家大型投资银行的高级技术分析师指出。“安全团队手动查看无休止的录像。媒体公司无法在自己的档案中找到特定场景。营销部门难以从宣传视频中提取洞察。”

这种低效率转化为了巨大的市场机遇。全球视频分析市场在2024年估值约为123.3亿美元,预计到2034年将达到近945.6亿美元,在此期间的复合年增长率(CAGR)为22.6%。

随现实扩展的计算记忆

Memories.ai 的方法独特之处在于其规模和架构。LVMM 首先将原始视频摄取并压缩成一个结构化记忆层,然后在任意时间跨度内建立视觉元素之间的上下文关联。

“传统模型逐帧或以短片段分析视频,从而失去了片段之间的所有上下文,”周恩民解释说。“我们的系统模仿人类记忆——保留重要信息同时过滤掉噪音,在相关事件之间建立连接,并允许通过自然语言检索特定时刻。”

据报道,该技术可以扩展到处理多达1000万小时的视频素材——比当前能力高出数个数量级。更令人印象深刻的是,大部分处理可以直接在用户设备上进行,而不仅仅是在云端。

从安防摄像头到好莱坞档案

早期应用主要集中在那些被视频数据淹没的领域:

在安全和监控领域,该系统可以即时从海量档案中调出相关录像——可能将事件调查时间从数天缩短到数分钟。对于媒体公司而言,它有望使庞大的内容库能够按场景、道具、角色或动作即时搜索。

营销团队可以分析数千个社交媒体视频中的趋势,而机器人公司则看到了机器通过视觉经验持续学习的潜力。

对于消费者应用而言,最引人入胜的或许是该技术能让用户通过自然语言查询来搜索他们的个人视频收藏,例如“找到我女儿第一次学步的视频”或“给我看我们假期中所有的海滩日落”。

视频记忆主导权之争

Memories.ai 并非唯一看到这一机遇的公司。TwelveLabs 已通过多轮融资筹集了8000万美元,其中包括 NEA、NVIDIA NVentures、Databricks、Snowflake 等的参与。然而,他们的技术目前仅针对长度不超过60分钟的视频进行了优化。

其他竞争对手包括 mem0(由YC支持,主要专注于文本记忆)、Letta(从Felicis获得1000万美元种子轮融资),以及谷歌(Google)的视频智能API(Video Intelligence API)和亚马逊(Amazon)的Rekognition等科技巨头的现有产品。

“Memories.ai 的独特之处在于其目标规模和其端侧处理能力,”一位专注于AI投资的风险合伙人观察到。“如果他们能以可接受的性能兑现承诺的一半,他们就将超越目前的市场领导者。”

前进之路:机遇与挑战

尽管技术前景广阔且市场巨大,Memories.ai 仍面临重大障碍。该公司必须证明其系统在实际部署中能够在大规模下保持准确性和性能——而不仅仅是受控演示。

对于这支以研究为主的团队而言,建立企业销售运营是另一个挑战,目前该团队仅有15名员工。在处理数百万小时视频的同时管理计算成本并保持价格竞争力,则构成了又一个障碍。

“构建可防御的护城河的时间窗口很短,”一家领先的技术投资公司的合伙人警告说。“微软的Copilot Memory将于下月发布,谷歌和亚马逊也正在迅速扩展其视频能力。”

投资视界:解读信号

对于关注视频智能领域的投资者而言,有几个指标可能预示着Memories.ai的发展轨迹:

转化率指标: 关注试点项目转化为六位数年度合同的公告,尤其是在安全和媒体等痛点最严重的垂直领域。

边缘部署成功: 在设备端执行大量分析的能力代表着潜在的竞争优势——尤其是在全球隐私法规日益严格的背景下。

单位经济效益: 处理效率将至关重要;每小时视频的计算成本必须大幅降低,才能在大规模部署下保持健康的利润率。

战略伙伴关系: 寻找与设备制造商(利用端侧能力)或安全系统集成商的潜在合作,这可能会加速企业采用。

市场观察人士提出了三种潜在结果:被大型公司战略性收购(Adobe、英伟达或AWS可能是潜在收购方),成长为独立上市公司,或者作为“记忆SDK”集成到边缘硬件中。

尽管该技术看起来很有前景,但机构投资者在投入大量资金之前应进行彻底的技术验证。针对超过4万小时的冷数据集测试该系统,并与竞争对手的精准度/召回率指标进行比较,将为Memories.ai能否实现其宏伟目标提供有价值的洞察。

随着企业和消费者都在与日益增长的视频数据量作斗争,打造能够真正理解和记住所见内容的机器的竞赛,有望在未来几年重塑技术市场和用户体验。

您可能也喜欢

本文是根据我们的用户在 新闻提交规则和指南下提交的。封面照片是计算机生成的艺术作品,仅用于说明目的;不表明实际内容。如果您认为本文侵犯了版权,请毫不犹豫地通过 发送电子邮件给我们来举报。您的警惕和合作对帮助我们维护尊重和合法合规的社区至关重要。

订阅我们的通讯

通过独家预览了解我们的新产品,获取企业业务和技术的最新资讯

我们网站使用Cookie来启用某些功能,为您提供更相关的信息并优化您在我们网站上的体验。更多信息请参阅我们的 隐私政策 和我们的 服务条款 。强制性信息可在 法律声明