索引
近年来,生成式人工智能技术备受瞩目。科技公司OpenAI,即ChatGPT的开发者,最新推出了名为「Sora」的新作。只需输入简单文字描述,即可自动生成精美影像,其细节精致、画面生动。然而,该模型目前仍处于测试阶段,尚有一些不足之处,未来上线前还需通过严格的安全测试。
Sora 是什么
Sora在日语中意味着天空,它是一种文本到视频的扩散模型,与使用文本提示创建图像的Dall-E非常相似。Sora使用文本提示创建短视频,只需简单的提示即可生成长达一分钟的视频。这款模型能够拍摄现有的静态图像并从中生成视频,保持视觉质量并遵守用户的提示,对小细节的关注使得影像更加生动。
Sora的工作原理是令人惊叹的。它使用“transformer架构”逐步消除噪音并创建视频,想象一下,从电视上的静态画面开始,逐渐消除模糊,直到您看到一个清晰、移动的视频。用户只需提供文本描述,就可以引导视频的内容,确保所需场景的呈现,例如确保一个人即使离开屏幕一会儿也能保持可见。Sora可以一次生成整个视频,而不仅仅是逐帧生成,通过分解视频成更小的部分,称为补丁,来实现这一功能。
Sora的应用范围广泛,从教育教学、产品演示到内容营销等,都可以通过Sora来实现高质量的视频内容创作。OpenAI在其博客文章以及社交媒体平台上发布了多个Sora工作的例子。
Sora 怎么操作
想要使用Sora,首先需要注册OpenAI账户并获得plus账户,获得Sora的访问权限。接下来,只需按照以下步骤操作:
步骤1:对您想要在视频中显示的内容写出清晰简洁的描述。具体说明场景、人物、动作和整体基调。您提供的细节越多,Sora就越能理解您的愿景。
步骤2:完成文本描述和自定义设置后,点击“生成视频”按钮。Sora将开始处理您的请求,这可能需要几分钟时间。完成后,您可以预览生成的视频。
步骤3:用户可以灵活地编辑和更改生成的场景。
Sora的常见问题解答
1. OpenAI何时向公众发布Sora?
OpenAI尚未公布Sora的具体发布日期,该模型目前处于测试阶段。
2. 用户可以使用Sora控制生成的场景吗?
是的,用户可以使用Sora控制生成的场景,包括输入书面提示来描述所需的场景,并根据需要进行编辑和更改。
3. Sora采取了哪些安全措施来防止滥用?
OpenAI正在积极采取安全措施来解决Sora的潜在滥用问题,目前Sora还未向公众开放,访问权限由OpenAI自行决定。