AI视频工具

Phenaki

开发AI视频生成技术,根据文本描述生成连续的视频内容,推动视觉媒体创作的发展。

简介

Phenaki是由Google Research团队开发的一款革命性AI视频生成工具,能够根据用户输入的文本提示或故事脚本自动合成高质量、动态变化的视频内容。作为开放域文本生成视频领域的先驱,Phenaki支持生成长达数分钟的视频,突破了传统视频生成模型在长度和连贯性上的限制。其核心技术结合了因果注意力机制和双向变换器模型,实现了对复杂场景和动态情节的精准呈现。

特点

1. 动态时间轴控制:用户可通过输入随时间变化的文本提示,生成具有故事逻辑的视频。例如,输入“宇航员在火星行走→观察星空→返回地球”等连续指令,模型会自动衔接场景。

2. 多模态输入兼容:支持从静态图像扩展生成视频。上传首帧图片并输入文本描述,即可生成如“白猫打哈欠”或“城市夜景车流”的连贯画面。

3. 高分辨率输出:采用C-ViViT编码器-解码器架构,视频分辨率可达1280×768,帧率稳定在24fps,画面细节媲美专业制作。

4. 多样化风格支持:可生成写实、卡通、科幻等多种艺术风格,甚至能模仿梵高或像素画等特定美学特征。

如何使用

1. 文本输入:在官网编辑器中输入时间轴明确的文本序列,例如“第一视角骑摩托车穿越森林→刹车特写→切换到空拍城市全景”。

2. 参数调节:通过滑动条调整视频长度(1-300秒)、镜头运动速度(慢速/常速/快速)和艺术风格强度(0-100%)。

3. 预览与迭代:生成30秒预览片段后,可针对特定帧添加局部重绘指令,如“放大泰迪熊面部表情”或“增强篝火光照效果”。

4. 导出设置:支持MP4、MOV格式导出,提供480P到4K多档分辨率选择,适配社交媒体或专业影视需求。

价格

目前Phenaki处于测试阶段,提供免费基础版服务,包含每月10次生成机会(单次最长30秒)。专业版预计2025年Q2上线,订阅费用为49美元/月,支持8K输出、商业授权和优先渲染队列。教育机构与非营利组织可申请学术许可,享受50%费用减免。

优化创作的小贴士

1. 提示词结构化:采用“主体+动作+环境+镜头语言”四要素模板,例如“金毛犬(主体)在沙滩奔跑(动作),夕阳映照海浪(环境),无人机俯拍转特写(镜头)”。

2. 分镜脚本预处理:先用ChatGPT将故事大纲拆解为10-15个关键帧描述,再输入Phenaki提升情节连贯性。

3. 混合素材生成:结合RunwayML进行局部风格迁移,如在生成视频后,用AI工具单独处理天空特效或人物服装细节。

常见问题

Q:支持中文提示词吗?
A:当前版本主要适配英文,但可通过Google翻译API实现中文指令自动转换,建议使用简单句式和明确动词。

Q:生成视频的版权归属?
A:用户拥有生成内容的所有权,但需确保输入文本不侵犯第三方知识产权。商业使用时建议添加水印标识AI生成属性。

Q:能否导出原始工程文件?
A:专业版将提供分层输出功能,可单独导出背景、主体动作和特效轨道,便于在Premiere或DaVinci Resolve中二次编辑。

相关导航

暂无评论

暂无评论...