19157628936

文生视频大模型Sora爆火出圈,景联文科技上新百万段视频描述数据集!

时间:2024-03-01 09:54:41

作者:景联文科技

浏览:

2024年2月15日,OpenAI发布人工智能文生视频大模型Sora。

 

Sora是基于OpenAI的DALL-E模型开发的视频生成技术,能根据文本描述创建最长60秒的逼真视频。包括多个角色、特定类型动作和主题背景;在单个生成的视频中创建多个镜头,可以模拟复杂的摄像机运镜,同时准确地保持角色和视觉风格;可以深度模拟真实物理世界,继承DALL-E 3的高画质和指令遵循能力,理解用户需求。

 

20240301.png 

 

Sora的技术原理

Sora的技术原理主要基于深度学习和分布式训练技术。Sora采用了扩散型变换器(diffusion transformer)架构,这是一种深度学习模型,能够将随机噪声逐渐转化为有意义的图像或视频内容。

 

Sora采用了分布式训练的方式AI模型的训练任务拆分成多个子任务,并在多个节点上并行执行。采用数据并行和模型并行的策略,以及自定义的通信协议,实现节点之间的高效通信。

 

这些技术原理使得Sora能够生成高质量的视频内容,并在模拟数字世界、长期连续性和物体持久性等方面展现出强大的能力。

 

高质量、大规模、描述精细的视频描述数据已成为Sora模型学习重要的一环。

 

景联文科技是大语言模型数据供应商,可为文生视频大模型提供大量高质量数据,提高大模型的准确性和性能。自有大规模、高质量视频描述成品数据集近百万段,内容涵盖广泛。

 

视频描述数据集

数据规模为万段视频及文本描述,涵盖多种通常场景。针对视频内容,采取简述和复杂描述两种标注方式,首先对视频整体内容进行简要概括。随后,确定视频中内容发生变化的具体时间点,并对每个时间段的子视频进行详细的内容描述。

 

为确保业务操作的安全性和合规性,满足不同业务场景下的数据保护需求,景联文科技有一套全面的数据安全与合规管理方案,涵盖版权数据产品、数据定制服务的私有化部署。

 

景联文科技提供大语言模型训练数据的标注服务,建立一系列数据分发、清洗、标注、质检、交付的标准化操作流程

 

为全球数千家人工智能从业公司和高校科研机构交付海量、高质量的AI大语言模型训练数据。

 

景联文科技|数据采集|数据标注|多模态数据集

助力人工智能技术,赋能传统产业智能化转型升级

 

文章图文著作权归景联文科技所有,商业转载请联系景联文科技获得授权,非商业转载请注明出处。

 


做AI行业客户的数据参谋
客户咨询电话:19157628936
地址:杭州市萧山区杭州湾信息港E幢7楼
微信公众号 客户咨询微信