Примечательно, что ответ заключается не в обширном обучении — по крайней мере, не со стороны исследователей. Вместо этого PhysiOpt использует предварительно обученную модель, которая уже видела тысячи форм и объектов. “Существующие системы часто требуют большого дополнительного обучения, чтобы иметь семантическое представление о том, что вы хотите видеть”, - добавляет соавтор Клеман Жамбон, который также является аспирантом MIT EECS и исследователем CSAIL. “Но мы используем модель, в которой уже заложено то, что вы хотите создать, поэтому PhysiOpt не требует обучения”.
Работая с предварительно обученной моделью, PhysiOpt может использовать “априорные данные о форме”, или знания о том, как должны выглядеть формы, основанные на более раннем обучении, для создания того, что хотят видеть пользователи. Это похоже на то, как художник воссоздает стиль известного художника. Их опыт основан на тщательном изучении различных художественных подходов, поэтому они, вероятно, смогут отразить эту конкретную эстетику. Аналогичным образом, знакомство предварительно обученной модели с формами помогает ей создавать 3D-модели.
Исследователи CSAIL заметили, что визуальное ноу-хау PhysiOpt помогло ему создавать 3D-модели более эффективно, чем “
DiffIPC”, аналогичный метод, имитирующий и оптимизирующий формы. Когда перед обоими подходами стояла задача создания 3D-дизайнов для таких предметов, как стулья, система CSAIL работала почти в 10 раз быстрее за итерацию, создавая при этом более реалистичные объекты.
PhysiOpt представляет собой потенциальный мост между идеями и реальными личными вещами. Например, то, что вам может показаться отличной идеей для кофейной кружки, вскоре может переместиться с экрана вашего компьютера на ваш рабочий стол. И хотя PhysiOpt уже проводит стресс-тестирование для дизайнеров, вскоре он может быть способен прогнозировать ограничения, такие как нагрузки и границы, вместо того, чтобы пользователям нужно было предоставлять эти детали. Этот более автономный подход, основанный на здравом смысле, может стать возможным благодаря внедрению языковых моделей vision, которые сочетают понимание человеческого языка с компьютерным зрением.