Видеомодель
, представленная в феврале, по-видимому, не была готова, когда ее впервые анонсировали. Сообщается, что Generations заняли более десяти минут, а отзывы от создателей фильмов иногда были критическими.
Режиссеру Патрику Седербергу пришлось сгенерировать сотни клипов, прежде чем получить пригодный для использования, поскольку модель изо всех сил пыталась поддерживать единообразные стили, объекты и персонажей на протяжении всего видео. По данным The Information, также имели место физические ошибки.
Подобные проблемы распространены в других видеомоделях; улучшенная версия Sora направлена на решение многих из этих проблем. Чтобы улучшить Sora, OpenAI собирает миллионы часов видеоматериалов высокого разрешения в качестве обучающих данных, охватывающих различные стили и темы, чтобы уменьшить предвзятость, согласно источнику.