VOID от Netflix: ИИ-модель для удаления объектов из видео с пониманием контекста -

Стриминговый гигант Netflix представил миру инновационную разработку в области искусственного интеллекта — модель VOID. Эта нейросеть предназначена для удаления объектов из видеороликов, но её ключевая особенность заключается в глубоком понимании контекста. В отличие от простого вырезания пикселей, VOID анализирует сцену и предсказывает физические последствия удаления объекта.

Например, если пользователь попросит убрать подставку, на которой лежит книга, модель не оставит книгу висеть в воздухе. Вместо этого она реалистично «заставит» её упасть, дорисовав соответствующие кадры и обеспечив плавность видео. Такой подход к редактированию открывает новые горизонты для создателей контента, видеомонтажёров и даже реставраторов архивных записей, позволяя бесшовно очищать кадр от ненужных элементов.

Netflix, известный своими технологическими инновациями, сделал модель открытой. Исходный код VOID уже доступен на платформе GitHub, что позволяет разработчикам по всему миру изучать, дорабатывать и интегрировать эту технологию в свои проекты. Кроме того, для всех желающих доступно онлайн-демо на Hugging Face, где можно в реальном времени оценить возможности нейросети.

Этот шаг укрепляет позиции Netflix не только как лидера в развлечениях, но и как серьёзного игрока в сфере AI-исследований. Технология VOID демонстрирует, как машинное обучение может выйти за рамки простой фильтрации и начать работать с видеоконтентом на семантическом уровне, предвосхищая физические взаимодействия в кадре. Ожидается, что подобные инструменты вскоре станут стандартом в профессиональном видеопроизводстве.

Это интересно