丝袜 英语 字节承接高校出品!STAR 模子:晋升视频明晰度和分辨率
近日,南京大学的探讨团队与字节跳跃、西南大学承接推出了一项立异技能 ——STAR(Spatial-Temporal Augmentation with Text-to-Video Models),旨在专揽文本到视频模子,结束信得过寰宇视频的超分辨率措置。该技能勾搭了时空增强步伐,大要有用提险峻分辨率视频的质地丝袜 英语,尤其适用于在视频共享平台高下载的低明晰度视频。
为了浮浅探讨者和设备者使用,探讨团队依然在 GitHub 上发布了 STAR 模子的预测验版块,包括 I2VGen-XL 和 CogVideoX-5B 两种型号,以及斟酌的推理代码。这些器用的推出璀璨着在视频措置鸿沟的一次蹙迫发扬。
使用该模子的流程相对豪放。领先,用户需要从 HuggingFace 下载预测验的 STAR 模子丝袜 英语,并将其放入指定目次。接着,准备待测试的视频文献,并聘用符合的文本辅导选项,包括无辅导、自动生成或手动输入辅导。用户只需调换剧本中的旅途建设,便可轻松进行视频超分辨率的措置。
该名目至极经营了两种基于 I2VGen-XL 的模子,分辨用于不同进度的视频降质措置,确保大要愉快多种需求。此外,CogVideoX-5B 模子迥殊复旧720x480的输入情景,为特定场景提供了机动的聘用。
该探讨不仅为视频超分辨率技能的发展提供了新的念念路,还为斟酌鸿沟的探讨者们开辟了新的探讨处所。探讨团队对 I2VGen-XL、VEnhancer、CogVideoX 和 OpenVid-1M 等前沿技能示意感谢,以为这些技能为他们的名目奠定了基础。
女同a片名目进口:https://github.com/NJU-PCALab/STAR
划要点:🌟 新技能 STAR 勾搭文本到视频模子,结束视频超分辨率,晋升视频质地。 🛠️ 探讨团队已发布预测验模子和推理代码丝袜 英语,使用流程下里巴人。 📩 提供斟酌面孔,饱读吹用户与探讨团队进行疏浚与探讨。