Sony Woosh汉化版,支持中文提示词

图片[1]-Sony Woosh汉化版,支持中文提示词-乐声音频-资源网

转载至BILIBILI:生活作弊码

🔊 Sony AI Woosh:最强音效生成模型 – 绿色一键懒人包 很多小伙伴留言希望能有一个生成音效的工具,我把 Sony AI 最新的开源项目 Woosh做成了懒人包。 该模型能够根据文字描述生成高品质音效,甚至能为你的视频片段自动配上精准的同步音效!

🌟 本包特色 开箱即用:基于 WinPython 深度定制,无需安装 Python 或配置环境变量,解压即用。 完全绿色:强制锁定模型缓存路径在文件夹内。 一键启动:内置3个启动脚本,支持自动打开浏览器界面。 汉化界面:UI 标签全中文处理,操作不再有门槛。 智能翻译:内置中英文翻译功能,支持中文提示词,点击即刻翻译回填。 离线运行:除翻译功能外,所有核心模型均支持断网运行。

🛠️ 包含模式说明 Woosh-Flow (质量模式):采用流匹配技术,生成步数多,音质细节极其丰富,适合追求极致效果的创作者。 Woosh-DFlow (极速模式):基于蒸馏技术,仅需 4 步即可成像!生成速度提升 10 倍以上,秒出音效,适合快速预览。 Woosh-VFlow (视频配音版):上传视频,模型会自动识别画面动作并配上同步音效(如铲雪声、赛车轰鸣、脚步声等)。

💻 硬件要求 系统:Windows 10/11 (64位) 显卡:NVIDIA 显卡 (必须) 显存:建议 8G 或以上(V2A 视频配音模式较吃显存) 驱动:建议更新至较新版本的 NVIDIA 驱动以支持 CUDA 12.8

🚀 使用教程 解压:将下载好的压缩包解压到 纯英文路径(避免中文路径报错)。 环境检查:如果遇到xxx.dll报错,请安装包里的VC运行库。 启动: 双击 一键启动文本转音效_极速模式.bat (生成速度快、质量略低) 双击 一键启动文本转音效_质量模式.bat (生成速度慢、质量最高) 双击 一键启动视频转音效.bat 生成:在浏览器弹出的界面中输入中文描述,点击翻译,最后点击“立即生成”即可。

⚠️ 注意事项 翻译功能:翻译按钮需要连接网络,如果完全断网,请直接在 English Prompt 框输入英文。 视频转音效功能最长支持8s视频片段,生成时实测显存占用9G左右,请注意。

版权声明: 项目地址:https://github.com/SonyResearch/Woosh/ 本项目代码遵循 MIT 开源协议。 模型权重(Weights)由 Sony Research 提供,遵循 CC-BY-NC 4.0 协议,严禁用于商业用途或二次售卖。

本懒人包仅供学术交流与爱好者研究使用。

Sony Woosh汉化版,支持中文提示词-乐声音频-资源网
Sony Woosh汉化版,支持中文提示词
此内容为免费资源,请登录后查看
R币0
演示视频需要梯子❗️资源持续更新❗️永久会员全站资源免费下载❗️统一解压密码: lsypstudio.com 或 qq...qqn❗️如遇到"任何问题"请 添加右下角微信
免费资源
© 版权声明
THE END
分享
相关推荐