|
从昨天开始,它在文本转视频(无音频)赛道便登顶第一。根据当前实时数据,其 Elo 分数已达到 1375,直接甩开第二名 Seedance 2.0 大概 100 分左右。
这个分差相当夸张,简直是断层式碾压。要知道,从第二名的 Seedance 2.0 到第十名,相差也不过 50 分左右。 在图像转视频(无音频)赛道,它更是跑出了 1409 的恐怖高分,刷新了该榜单的历史纪录。
而在有音频赛道,目前 HappyHorse-1.0 也已经拿下全球第一的成绩,超越 Seedance 2.0。
多方消息称,HappyHorse-1.0 出自阿里旗下张迪领衔的淘天集团未来生活实验室。 屠榜视频 Arena Artificial Analysis 的 Video Arena 的排名机制,是数千名真实用户在完全不知情的情况下,对两段生成结果进行盲测对比得出的 Elo 体系。 也就是说,多数用户在不知道视频由哪家模型生成的情况下,选择了 HappyHorse-1.0。 我也迫不及待地上手试了一下,在连续几次盲测都选中「欢乐马」之后,我开始感觉它的实力真的不容小觑。 先看第一个案例:
对比两个视频,可以明显看出右边的生成效果更具真实感,细节也更加丰富。无论是整体色调还是镜头的设置,都很像一个电影开场。 而左边的嘛……虽然提示词要求"血红色的天空背景",但这天空未免也太红了,有点过于夸张。 选择之后答案揭晓:右边是「欢乐马」,左边是 Pyramid-Flow。 再来看看这个:
很显然,右边的画面更加自然,特写 - 近景 - 远景的镜头切换也很流畅,完全还原了提示词要求的"长枪短炮"的新闻发布会场面。 相比之下,左边的效果一开场就显得有些怪异,主人公站的位置不太合理,也没有营造出足够热烈的现场氛围。 答案揭晓——右边是「欢乐马」,左边则是 Veo 3.1 Lite。 接下来是第三个案例:
可能因为输入了提示图片,这两个模型的生成效果乍一看差不多。 但我还是选择了右边。原因是左边的镜头拉近速度有点太快了,不太符合现场专注工作的安静氛围。 并且右边的镜头拉近之后,会发现人物脸上的纹理被还原得更好,更具真实感;而左边人物则显得面部太光滑了。 投票之后,答案又揭晓了:右边还是这匹「欢乐马」,左边则是 PixVerse V6。 盲测了十几个案例之后,但凡出现「欢乐马」的,我大部分都选中了,只有少数几个案例我没有选择「欢乐马」而选了其他模型。 这实力可想而知,也难怪空降屠榜了。 根据目前已知消息,Happy Horse-1.0 采用 40 层单流 Transformer 架构,原生支持音视频同步生成,仅需 8 步去噪即可输出 1080P 视频。 在 H100 显卡上生成 5 秒片段仅需 38 秒,推理速度较传统模型大幅提升。其技术突破包括多模态统一建模、无 CFG 引导生成等。 原生支持中文(包括粤语)、英语、日语、韩语、德语、法语。 更重要的是,据说完全开源——基础模型 + 蒸馏模型 + 超分 + 推理代码,都会开源出来。 或出自阿里淘天 关于 Happy Horse-1.0 背后是哪家公司,目前猜测主要集中在国内。 而在众多选项中,呼声最高的是阿里淘天未来生活实验室,由前快手 Kling 一号位张迪领导。
张迪,上海交通大学本硕毕业,职级 P11,直接向淘天集团首席科学家兼阿里妈妈 CTO 郑波汇报。 他于 2010 年毕业后便加入阿里,担任资深技术专家,负责阿里妈妈大数据与机器学习工程架构。 2020 年,他曾转战快手,历任技术副总裁、大模型与多媒体技术团队负责人。在快手,他牵头了可灵大模型的底层架构研发与应用落地,成功推出了可灵 1.0/2.0 视频生成模型。 2025 年 9 月初,张迪加入哔哩哔哩,出任技术条线负责人。 2025 年 11 月,张迪离开哔哩哔哩,重返阿里,担任淘天集团未来生活实验室负责人。 目前,Happy Horse-1.0 还处于无官网(目前出现的几个官网都被打假了)、无技术报告、无代码库的状态。 有消息称团队现在每晚都在加班加点,10 号会正式发布,也是可以期待一下了。 一键三连「点赞」「转发」「小心心」 欢迎在评论区留下你的想法! — 完 — � � 谁会代表 2026 年的 AI? 龙虾爆火,带动一波 Agent 与衍生产品浪潮。 但真正值得长期关注的 AI 公司和产品,或许不止于此。 如果你正在做,或见证着这些变化,欢迎申报。 让更多人看见你。� � https://wj.qq.com/s2/25829730/09xz/ 一键关注 � � 点亮星标 科技前沿进展每日见 |









