比格熊博客 - 软件更新日志

1TB+ ComfyUI本地大模型打包下载

我是大熊 2026-03-17

这里的文件只包含模型不包含任何程序文件

所以下载后直接覆盖到的ComfyUI模型目录就可以了

自从去年下半年到现在所有我下载的模型都在这里了

## 目录

1. [基础模型 (Checkpoints)](#1-基础模型-checkpoints)

2. [扩散模型 (Diffusion Models)](#2-扩散模型-diffusion-models)

3. [LoRA 模型](#3-lora-模型)

4. [ControlNet 模型](#4-controlnet-模型)

5. [VAE 模型](#5-vae-模型)

6. [CLIP 和文本编码器](#6-clip-和文本编码器)

7. [CLIP Vision 模型](#7-clip-vision-模型)

8. [超分模型 (Upscale Models)](#8-超分模型-upscale-models)

9. [VAE Approx 模型](#9-vae-approx-模型)

10. [音频编码器](#10-音频编码器)

11. [风格模型](#11-风格模型)

12. [GLIGEN 模型](#12-gligen-模型)

13. [XLabs 模型](#13-xlabs-模型)

14. [FlashVSR 模型](#14-flashvsr-模型)

15. [UNet 模型](#15-unet-模型)

16. [模型补丁 (Model Patches)](#16-模型补丁-model-patches)

17. [根目录模型](#17-根目录模型)

18. [模型配合关系汇总](#18-模型配合关系汇总)

---

## 1. 基础模型 (Checkpoints)

基础模型是图像生成的核心模型，包含完整的U-Net、VAE和文本编码器。

|---------|------|---------|-------------|

---

## 2. 扩散模型 (Diffusion Models)

分离式扩散模型，通常需要配合特定的文本编码器和VAE使用。

|---------|------|---------|-------------|

---

## 3. LoRA 模型

LoRA（Low-Rank Adaptation）用于微调基础模型的风格或添加新概念。

| 模型名称 | 适用基础模型 | 主要用途 |

|---------|-------------|---------|

| `Loraeyes_V1.safetensors` | SD 1.5 | 眼睛细节优化LoRA |

| `blindbox_v1_mix.safetensors` | SD 1.5 | 盲盒/手办风格LoRA |

| `MoXinV1.safetensors` | SD 1.5 | 墨心/中国画风格LoRA |

| `dmd2_sdxl_4step_lora.safetensors` | SDXL | DMD2 4步快速生成LoRA |

| `ltxv-13b-0.9.7-distilled-lora128.safetensors` | LTX-Video | LTXV 蒸馏LoRA，加速生成 |

| `Hyper-FLUX.1-dev-8steps-lora.safetensors` | FLUX.1 Dev | HyperSD 8步快速生成LoRA |

| `Hyper-FLUX.1-dev-16steps-lora.safetensors` | FLUX.1 Dev | HyperSD 16步生成LoRA |

| `Wan21_CausVid_14B_T2V_lora_rank32.safetensors` | Wan 2.1 14B | CausVid 因果视频生成LoRA |

| `Wan21_CausVid_bidirect2_T2V_1_3B_lora_rank32.safetensors` | Wan 2.1 1.3B | CausVid 双向因果视频生成LoRA（小模型版） |

| `lightx2v_T2V_14B_cfg_step_distill_v2_lora_rank64_bf16.safetensors` | Wan 2.1 14B T2V | LightX2V CFG蒸馏LoRA，加速文生视频 |

| `lightx2v_I2V_14B_480p_cfg_step_distill_rank64_bf16.safetensors` | Wan 2.1 14B I2V | LightX2V CFG蒸馏LoRA，加速图生视频 |

| `ltx-2-19b-distilled-lora-384.safetensors` | LTX-2 19B | LTX-2 蒸馏LoRA |

| `ltx-2-19b-lora-camera-control-dolly-left.safetensors` | LTX-2 19B | LTX-2 相机控制LoRA（左移） |

| `Qwen-Image-Lightning-4steps-V1.0.safetensors` / `Qwen-Image-Lightning-8steps-V1.0.safetensors` | Qwen Image | Qwen图像闪电快速生成LoRA |

| `Qwen-Image-Edit-2509-Lightning-4steps-V1.0-bf16.safetensors` / `Qwen-Image-Edit-2511-Lightning-4steps-V1.0-bf16.safetensors` | Qwen Image Edit | Qwen图像编辑闪电LoRA |

| `Qwen-Edit-2509-Multiple-angles.safetensors` | Qwen Image | Qwen多角度编辑LoRA |

| `uso-flux1-dit-lora-v1.safetensors` | FLUX.1 | USO-FLUX DiT LoRA |

| `wan2.2_t2v_lightx2v_4steps_lora_v1.1_high_noise.safetensors` / `wan2.2_t2v_lightx2v_4steps_lora_v1.1_low_noise.safetensors` | Wan 2.2 T2V | Wan 2.2 LightX2V 4步LoRA（高/低噪声版） |

| `wan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensors` / `wan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensors` | Wan 2.2 I2V | Wan 2.2 LightX2V 4步LoRA（高/低噪声版） |

| `removal_timestep_alpha-2-1740.safetensors` | Wan/FLUX | 时间步移除LoRA |

| `wan_alpha_2.1_rgba_lora.safetensors` | Wan 2.1 | Wan Alpha通道LoRA，支持RGBA生成 |

| `WanAnimate_relight_lorc_fp16.safetensors` | Wan | Wan动画重新打光LoRA |

| `ltx2-squish.safetensors` | LTX-Video | LTX视频压缩/变形效果LoRA |

| `ltx-2.3-22b-distilled-lora-384.safetensors` | LTX-2.3 22B | LTX-2.3 22B蒸馏LoRA，加速生成 |

| `Qwen-Image-Edit-2509-Light-Migration.safetensors` | Qwen Image Edit | Qwen图像编辑光照迁移LoRA |

| `Qwen-Image-Edit-2509-Lightning-8steps-V1.0-bf16.safetensors` | Qwen Image Edit | Qwen图像编辑闪电8步LoRA |

| `FireRed-Image-Edit-1.0-Lightning-8steps-v1.0.safetensors` | FireRed Image Edit | FireRed图像编辑闪电8步LoRA |

| `gemma-3-12b-it-abliterated_lora_rank64_bf16.safetensors` | Gemma 3 12B | Gemma 3 指令模型LoRA（rank64） |

| `WanAnimate_relight_lora_fp16.safetensors` | Wan | Wan动画重新打光LoRA（FP16版） |

---

## 4. ControlNet 模型

ControlNet 用于控制图像生成过程，基于各种条件输入。

|---------|-------------|---------|---------|

---

## 5. VAE 模型

VAE（变分自编码器）用于在像素空间和潜在空间之间转换图像。

| 模型名称 | 适用基础模型 | 主要用途 |

|---------|-------------|---------|

| `vae-ft-mse-840000-ema-pruned.safetensors` | SD 1.5 / SDXL | 标准VAE（840k步训练，EMA剪枝版） |

| `ae.safetensors` | FLUX 系列 | FLUX 官方VAE |

| `flux2-vae.safetensors` | FLUX.2 | FLUX.2 VAE |

| `wan_2.1_vae.safetensors` | Wan 2.1 | 万相视频VAE |

| `wan2.2_vae.safetensors` | Wan 2.2 | 万相2.2视频VAE |

| `wan_alpha_2.1_vae_rgb_channel.safetensors` / `wan_alpha_2.1_vae_alpha_channel.safetensors` | Wan Alpha | 万相Alpha通道VAE（RGB+Alpha分离） |

| `qwen_image_vae.safetensors` | Qwen Image | 通义千问图像VAE |

| `vaeFtMse840000EmaPruned_vaeFtMse840k.safetensors` | SD 1.5 | 另一种命名格式的VAE |

---

## 6. CLIP 和文本编码器

CLIP和文本编码器用于将文本提示转换为模型可理解的嵌入向量。

|---------|------|-------------|---------|

---

## 7. CLIP Vision 模型

CLIP Vision 用于处理图像输入，实现图生图、风格迁移等功能。

| 模型名称 | 主要用途 | 需配合的模型 |

|---------|---------|-------------|

| `clip_vision_g.safetensors` | CLIP Vision Large | IP-Adapter、图像反推、风格迁移 |

| `clip_vision_h.safetensors` | CLIP Vision Huge | 高清图像理解 |

| `sigclip_vision_patch14_384.safetensors` | SigCLIP Vision | SigCLIP 视觉编码器（384x384） |

| `checkpoints/clip_vision_g.safetensors` | 同上 | checkpoints目录副本 |

---

## 8. 超分模型 (Upscale Models)

用于图像放大和细节增强。

|---------|---------|---------|---------|

| `4xFaceUpSharpDAT.pth` | 4x | DAT | 面部专用超分 |

| `latent_upscale_models/ltx-2-spatial-upscaler-x2-1.0.safetensors` | 2x | LTX | LTX-2空间超分 |

| `latent_upscale_models/ltx-2.3-spatial-upscaler-x2-1.0.safetensors` | 2x | LTX | LTX-2.3空间超分 v1.0 |

| `latent_upscale_models/ltx-2.3-spatial-upscaler-x2-1.1.safetensors` | 2x | LTX | LTX-2.3空间超分 v1.1（更新版） |

---

## 9. VAE Approx 模型

VAE Approximation 模型用于快速潜在解码预览。

| 模型名称 | 适用基础模型 | 主要用途 |

|---------|-------------|---------|

| `taesd_encoder.safetensors` / `taesd_decoder.safetensors` | SD 1.5 | SD 1.5 快速VAE编解码器 |

| `taesdxl_encoder.safetensors` / `taesdxl_decoder.safetensors` | SDXL | SDXL 快速VAE编解码器 |

| `taesd3_encoder.safetensors` / `taesd3_decoder.safetensors` | SD 3 | SD 3 快速VAE编解码器 |

| `taef1_encoder.safetensors` / `taef1_decoder.safetensors` | FLUX | FLUX 快速VAE编解码器 |

---

## 10. 音频编码器

用于音频处理和语音识别的模型。

| 模型名称 | 主要用途 |

|---------|---------|

| `wav2vec2_large_english_fp16.safetensors` | Wav2Vec 2.0 Large，英语语音识别 |

| `whisper_large_v3_fp16.safetensors` | OpenAI Whisper Large v3，多语言语音识别 |

---

## 11. 风格模型

用于图像风格迁移和处理的模型。

| 模型名称 | 主要用途 | 需配合的模型 |

|---------|---------|-------------|

| `flux1-redux-dev.safetensors` | FLUX Redux 风格迁移 | FLUX 基础模型、CLIP Vision |

---

## 12. GLIGEN 模型

GLIGEN（Grounded Language-Image Generation）用于基于位置的图像生成。

| 模型名称 | 适用基础模型 | 主要用途 |

|---------|-------------|---------|

| `gligen_sd14_textbox_pruned.safetensors` | SD 1.4 | 基于文本框位置的图像生成 |

---

## 13. XLabs 模型

XLabs AI 开发的模型集合。

| 模型名称 | 主要用途 | 需配合的模型 |

|---------|---------|-------------|

| `ipadapters/ip_adapter.safetensors` | IP-Adapter | 图像提示适配器，实现图生图风格迁移 |

---

## 14. FlashVSR 模型

FlashVSR 视频超分辨率模型集合。

| 模型名称 | 主要用途 |

|---------|---------|

| `FlashVSR1_1.safetensors` | FlashVSR 主模型 |

| `LQ_proj_in.safetensors` | 低质量投影输入模型 |

| `Prompt.safetensors` | 提示编码器 |

| `TCDecoder.safetensors` | TC解码器 |

| `Wan2.1_VAE.safetensors` | Wan 2.1 VAE（FlashVSR专用） |

| `Wan2_1-T2V-1_3B_FlashVSR_fp32.safetensors` | Wan 2.1 T2V 1.3B FlashVSR版 |

| `Wan2_1_FlashVSR_LQ_proj_model_bf16.safetensors` | FlashVSR低质量投影模型BF16版 |

---

## 15. UNet 模型

UNet模型用于扩散过程的核心网络结构。

| 模型名称 | 类型 | 主要用途 |

|---------|------|---------|

| `z_image_bf16.safetensors` | Z Image UNet | Z Image 模型UNet网络（BF16精度） |

---

## 16. 模型补丁 (Model Patches)

模型补丁用于修改或增强基础模型的功能。

| 模型名称 | 适用基础模型 | 主要用途 |

|---------|-------------|---------|

| `uso-flux1-projector-v1.safetensors` | FLUX.1 | USO-FLUX投影器，用于图像风格迁移 |

---

## 17. 根目录模型

根目录下存放的独立模型文件。

| 模型名称 | 类型 | 主要用途 |

|---------|------|---------|

| `diffusion_pytorch_model_streaming_dmd.safetensors` | Streaming DMD | 流式扩散模型，用于实时生成 |

---

## 18. 模型配合关系汇总

### 18.1 SD 1.5 系列工作流

```

基础模型 (SD 1.5 checkpoint)

├── 可选: VAE (vae-ft-mse-840000)

├── 可选: LoRA (如 MoXinV1、blindbox)

└── 可选: ControlNet (OpenPose、Canny、Depth、Scribble)

```

### 18.2 SDXL 系列工作流

```

基础模型 (SDXL Base)

├── 可选: SDXL VAE

├── 可选: SDXL LoRA

├── 可选: SDXL ControlNet (Canny、T2I-Adapter)

└── 可选: SDXL Refiner (用于精修)

```

### 18.3 FLUX.1 系列工作流

```

基础模型 (FLUX Dev / Schnell)

├── 必须: CLIP_L (clip_l.safetensors)

├── 必须: T5-XXL (t5xxl_fp16 或 fp8)

├── 必须: FLUX VAE (ae.safetensors)

├── 可选: FLUX LoRA (如 Hyper-FLUX、USO-FLUX)

└── 可选: FLUX Redux (风格迁移)

```

### 18.4 SD 3.5 系列工作流

```

基础模型 (SD 3.5 Large)

├── 必须: CLIP_L (clip_l.safetensors)

├── 必须: CLIP_G (clip_g，如需要)

├── 必须: T5-XXL / UMT5-XXL

└── 可选: SD 3.5 ControlNet

```

### 18.5 Wan 2.1/2.2 视频工作流

```

基础模型 (Wan T2V / I2V / VACE)

├── 必须: Wan VAE (wan_2.1_vae 或 wan2.2_vae)

├── 可选: UMT5-XXL 文本编码器

├── 可选: Wan LoRA (CausVid、LightX2V)

└── 可选: Wan ControlNet

```

### 18.6 HiDream 工作流

```

基础模型 (HiDream I1)

├── 必须: HiDream CLIP组合 (clip_l_hidream + clip_g_hidream)

└── 必须: HiDream VAE

```

### 18.7 Qwen Image 工作流

```

基础模型 (Qwen Image)

├── 必须: Qwen VAE (qwen_image_vae)

├── 必须: Qwen 文本编码器 (qwen_2.5_vl)

└── 可选: Qwen LoRA (Lightning、Edit)

```

### 18.8 LTX Video 工作流

```

基础模型 (LTX-2 19B / LTX-2.3 22B)

├── 必须: LTX VAE

├── 可选: LTX 蒸馏LoRA (加速生成)

├── 可选: LTX 相机控制LoRA

└── 可选: LTX 空间超分模型 (2x放大)

```

---

## 附录：模型目录结构

```

models/

├── audio_encoders/ # 音频编码器 (Wav2Vec, Whisper)

├── checkpoints/ # 基础模型 (SD, SDXL, FLUX, SD3, Wan等)

├── clip/ # CLIP模型

├── clip_vision/ # CLIP Vision模型

├── controlnet/ # ControlNet模型

├── diffusion_models/ # 分离式扩散模型

├── gligen/ # GLIGEN模型

├── latent_upscale_models/ # 潜在空间超分模型

├── loras/ # LoRA微调模型

├── model_patches/ # 模型补丁

├── style_models/ # 风格模型

├── text_encoders/ # 文本编码器 (T5, UMT5等)

├── unet/ # UNet模型

├── vae/ # VAE模型

├── vae_approx/ # 快速VAE近似模型

├── upscale_models/ # 超分模型

├── FlashVSR/ # FlashVSR视频超分

└── xlabs/ # XLabs模型 (IP-Adapter等)

你可以一起下载也可以按需下载：

链接：https://pan.quark.cn/s/64598499e434

阅读全文

修复标签与标题脱离原始文件名的问题

我是大熊 2026-03-16

核心问题是：文件名中的中文部分是后期不准确的直译，而英文部分是准确的原始描述。需要优先使用英文部分进行翻译和标签生成。

英文部分是准确的原始描述，中文部分可能是后期不准确的直译，应优先使用英文部分
过滤无意义内容：天途影像、X 2 数量标识、错误直译词
单个中文数字（一、二、三等）应保留，不应被过滤
保持代码修改已提交到 git

Discoveries

问题根源：_extract_english_part 方法从完整路径提取英文而非只提取文件名
多层过滤问题：多个地方都有 len(word) >= 2 的过滤条件，导致单个中文数字被过滤
需要修改的位置：
- _extract_semantic_words 中的语义提取
- _filter_meaningless_tags 中的标签过滤
- _generate_natural_language_filename 中的文件名生成

Accomplished

新增 _extract_english_part() 方法提取英文部分（已修复路径问题）
新增 _optimize_filename_with_llm() 方法使用 Qwen 模型优化
扩展翻译词库（鸟类、猫、狗、身体部位、数字等约150词）
扩展 label_to_tags 映射表（约120词）
修复 NameError: quoted_content 未定义 错误
添加缺失的翻译词：finger→手指, five→五, six→六等
修改多处过滤逻辑允许单个中文数字通过

正在修复：单个中文数字在最终文件名生成时仍被过滤的问题

Relevant files / directories

python/classifier_v2.py - 主分类器，包含文件名处理逻辑
- _extract_english_part() - 提取英文部分
- _extract_semantic_words() - 提取语义词
- _generate_natural_language_filename() - 生成新文件名
- _translate_filename_to_chinese() - 翻译英文到中文
- _optimize_filename_with_llm() - LLM优化文件名
python/utils/tag_generator.py - 标签生成工具
- extract_filename_keywords() - 提取关键词
- _filter_meaningless_tags() - 过滤无意义标签
- MEANINGLESS_TAGS - 无意义标签列表
- translation_map - 翻译词库
python/utils/local_llm_tags.py - 本地LLM标签生成器

File: Five finger whistles..07034113.wav
Semantic: ['五', '手指', '口哨']  ✅ 正确
Keywords: ['五', '手指', '口哨']  ✅ 正确
CN Tags: ['五', '手指', '口哨', ...]  ✅ 正确
New Name: 手指_口哨_2df943.wav  ❌ 缺少 '五'

阅读全文

【已用光】激活码送给有缘人

我是大熊 2026-03-15

5X3W-33Q7-A5RA-6E93 RRLA-S397-B7QA-4R2E

DVYU-S5WC-8GEZ-8NTN M786-3DSD-HJ5P-PGFD

Y8L3-XKU2-U5F4-K6BN ECUH-XPSJ-MFU5-T5A2

84E4-4565-Q46P-7U9H 9S6S-8QJH-P2DL-RRU7

JZL3-YR8D-FL3L-TRR6 L7X7-B349-V5ZS-R93U

阅读全文

正在改进音效分类工具

我是大熊 2026-03-15

目前有大批的音效超过万首以上待审核

过去的音效分类工具虽然用了大模型

但是对于音效这种短音频文件

很难识别的特别准确

所有我整合了三个模型来做智能音效分类

希望能够尽快的完成音效库的搭建

毕竟工具体验再好

资源不完整也是白搭

阅读全文

## 📝 字幕模块 ### 新增：智能定位打开字幕面板时，自动跳转到当前播放头所在的字幕位置，不用再手动翻找了。 ### 优化：点击跳转现在只有**真正点击输入框**时才会跳转播放头，解决了之前"不小心碰到就乱跳"的问题。 ### 优化：后台自动释放当你切换到其他软件时，字幕输入框会自动失去焦点，避免意外修改字幕内容。 --- ## 🎵 音效模块 ### 修复：播放头位置添加音效后，播放头现在会停在音效的**开头位置**，方便你直接预听效果。（之前会跳到结尾，很烦人） ### 新增：智能避让添加音效时如果和已有内容重叠，会**自动创建新轨道**，不会再覆盖掉其他素材。 ### 优化：轨道命名音效轨道命名改为更简洁的 **BGX** 格式，时间线更清爽。 --- **一句话总结**：字幕定位更智能，音效添加更顺手。

阅读全文

我不太会写博客

我是大熊 2026-03-14

就记录一下比格熊的更新日志吧！

阅读全文

1 2 3 4

音频分类工具开发记录

1TB+ ComfyUI本地大模型打包下载

更新记录

更新记录

修复标签与标题脱离原始文件名的问题

Discoveries

Accomplished

Relevant files / directories

【已用光】激活码送给有缘人

正在改进音效分类工具

达芬奇音效字幕插件v1.2.4升级！

我不太会写博客