Phenaki

简介

Phenaki是由Google Research团队开发的一款革命性AI视频生成工具，能够根据用户输入的文本提示或故事脚本自动合成高质量、动态变化的视频内容。作为开放域文本生成视频领域的先驱，Phenaki支持生成长达数分钟的视频，突破了传统视频生成模型在长度和连贯性上的限制。其核心技术结合了因果注意力机制和双向变换器模型，实现了对复杂场景和动态情节的精准呈现。

特点

1. 动态时间轴控制：用户可通过输入随时间变化的文本提示，生成具有故事逻辑的视频。例如，输入“宇航员在火星行走→观察星空→返回地球”等连续指令，模型会自动衔接场景。

2. 多模态输入兼容：支持从静态图像扩展生成视频。上传首帧图片并输入文本描述，即可生成如“白猫打哈欠”或“城市夜景车流”的连贯画面。

3. 高分辨率输出：采用C-ViViT编码器-解码器架构，视频分辨率可达1280×768，帧率稳定在24fps，画面细节媲美专业制作。

4. 多样化风格支持：可生成写实、卡通、科幻等多种艺术风格，甚至能模仿梵高或像素画等特定美学特征。

如何使用

1. 文本输入：在官网编辑器中输入时间轴明确的文本序列，例如“第一视角骑摩托车穿越森林→刹车特写→切换到空拍城市全景”。

2. 参数调节：通过滑动条调整视频长度（1-300秒）、镜头运动速度（慢速/常速/快速）和艺术风格强度（0-100%）。

3. 预览与迭代：生成30秒预览片段后，可针对特定帧添加局部重绘指令，如“放大泰迪熊面部表情”或“增强篝火光照效果”。

4. 导出设置：支持MP4、MOV格式导出，提供480P到4K多档分辨率选择，适配社交媒体或专业影视需求。

价格

目前Phenaki处于测试阶段，提供免费基础版服务，包含每月10次生成机会（单次最长30秒）。专业版预计2025年Q2上线，订阅费用为49美元/月，支持8K输出、商业授权和优先渲染队列。教育机构与非营利组织可申请学术许可，享受50%费用减免。