AI Ops Report · 2026-06-11 JST

三块外接硬盘整理项目报告

一次由 AI 协助执行的本地存储治理:跨盘去重、批量重命名、目录归类、保护边界和可回滚记录。目标不是把文件“看起来变整齐”,而是降低满盘风险,让素材、工程、备份和临时区恢复可维护状态。

3外接硬盘纳入治理
622.5GB按批次报告合计释放空间
5,573安全范围普通媒体已重命名
0最终需人工复核的跨盘重复项

结果概览

最直接的变化是三块盘从“接近满盘、入口混乱”进入“有余量、有分区、有审计记录”的状态。

硬盘 整理前可用空间 当前可用空间 变化 当前角色
超大存储盘 约 18GiB 约 451GiB 约 +433GiB 冷归档主盘:原始素材、家庭活动、剪辑工程、AI 与电脑备份分区。
huawei 约 19GiB 约 216GiB 约 +197GiB 下载与个人影音归档盘;OpenClaw 保持根目录,不迁移。
剪辑库T7 约 68GiB 约 76GiB 约 +8GiB 剪辑工作盘;待分类已清空,后续空间重点是压缩已完成项目。
三块外接硬盘整理前后可用空间对比图
图 1:三块盘当前空间余量已从满盘风险转为可维护状态;超大存储盘和 huawei 是主要改善来源。

空间释放构成

释放空间来自多轮策略组合:先清高置信大视频,再处理跨盘中小媒体,最后做侧车文件和下载残留清理。

大文件内容去重
326.7GB
视觉/字节确认视频
188.9GB
跨盘 4-512MB
77.1GB
huawei 残留清理
29.6GB
侧车元数据
0.24GB
释放空间来源构成条形图
图 2:主要收益来自高置信媒体去重;后续继续优化的重点应转向压缩、归档和新增文件入口治理。

执行时间线

每一步都保留了批次目录、CSV manifest 和可回滚脚本;删除动作只在最终确认后发生。

三盘盘点与保护边界建立

确认三块盘容量、角色和目录风险;生成总入口报告,保护医院/医疗/设计、工程包、Final Cut 原始媒体等路径。

第一轮视觉确认与逐字节删除

只删除已视觉确认、路径低风险、并通过 cmp 的重复视频副本,共释放约 188.9GB。

批量重命名与 huawei 清理

安全范围普通媒体按日期与路径内容重命名 5,573 个;清理 huawei 下载残留、侧车文件和字节确认重复。

T7 待分类归入按年份结构

普通媒体、RAW/照片侧素材、音频和侧车文件归类;最终只剩 Final Cut 工程包。

工程包与 huawei 顶层结构整理

T7 的 .fcpbundle 整包移入工程包待确认区;huawei 顶层重排为已筛选与下载暂存,OpenClaw 保持根目录。

512MB 以上大媒体内容去重

扫描 1,680 个大媒体,最终删除 185 个 byte 完全一致副本,释放约 326.7GB。

三盘之间中小媒体去重

按 64-512MB、16-64MB、4-16MB 三档处理,只清跨盘重复,不处理同盘内部重复,共释放约 77.1GB。

超大盘一级目录归类

超大盘根目录归为 00/10/20/30/40/90 六类;“原始文件不可删除”和含问诊资料的文件目录保持原位。

去重方法

核心原则是:名字相同不等于内容相同,只有 byte 完全一致才自动删除。

1

按盘和目录白名单收集媒体,排除医院、设计、工程包、原始不可删除区。

2

按文件大小分组;跨盘任务要求候选至少来自两块不同硬盘。

3

读取开头、中段、结尾内容做抽样 SHA256,过滤大部分同大小但不同内容文件。

4

对抽样命中的候选执行 cmp -s,逐字节确认。

5

按保留优先级保留工作盘/已整理路径,删除下载暂存或旧副本。

目录结构结果

分类不是为了美观,而是让下一次导入、检索、备份和压缩有明确落点。

超大存储盘

  • 00_不可删除_原始素材:手机、相机、照片、视频、全景素材。
  • 10_家庭活动素材:家庭记录、活动、万博、公园、运动会。
  • 20_剪辑工程与成品:剪辑资源、工程备份、画质测试、待压缩。
  • 30_AI与电脑备份:Mac/项目/知识库/AI 系统冷备。
  • 40_娱乐与下载归档90_临时与待确认 分开。

huawei

  • 10_个人影音_已筛选:保留筛选后的归档区。
  • 20_下载暂存:下载器与临时下载集中。
  • openclaw:保持根目录,不迁移,降低脚本路径断裂风险。
  • 已清理下载残留、侧车文件和多轮跨盘重复。

剪辑库T7

  • 待分类:已清空为目录壳。
  • 按年份/待分类已整理:承接普通媒体、RAW、音频和工程包待确认区。
  • 10_成品视频需要压缩 保持职责分离。
  • 后续空间收益主要来自压缩/归档,不再主要依赖去重。

保护策略

这次整理能自动推进,是因为明确了哪些地方绝不自动碰。

未参与自动删除/重命名的范围:医院、医疗、设计相关路径;Final Cut 工程包内部;Final Cut 插件、代理媒体、Original Media;标记为原始不可删除的目录;含问诊资料的文件目录。

不按文件名删除 删除前逐字节确认 移动批次保留 rollback 公开报告脱敏

批次记录摘要

这些是本机可追溯的主要批次名;完整 CSV 与 rollback 不发布到公网。

批次动作结果
visual-confirmed-delete视觉 + cmp 确认视频副本23 个,约 188.9GB
rename-safe-media安全范围普通媒体重命名5,573 个,复扫新增 0
huawei-clean下载残留、侧车、字节重复约 29.6GB
classify-t7-by-date / leftovers / audio / fcpbundleT7 待分类归档普通媒体、RAW、音频、工程包归位
deep-large-dedupe512MB 以上大媒体内容去重185 个,约 326.7GB
cross-volume-medium-dedupe4-512MB 三盘之间重复去重792 个,约 77.1GB
classify-superdisk-top-level超大盘一级目录归类42 个顶层项目归位

后续建议

继续优化的收益已经从“去重”转向“压缩、归档策略和导入习惯”。

下一步优先级

  • T7 的 需要压缩 按项目进入 H.265/归档压缩工作流。
  • 新素材导入时直接落到年份/项目目录,避免再次出现“待分类黑洞”。
  • huawei 继续作为下载/个人影音盘,不再混入活服务、数据库或 AI 缓存。

暂不建议自动做

  • 不继续自动删除 4MB 以下小文件,收益低且缩略图/聊天图误判风险更高。
  • 不自动压缩原片,除非确认至少两份可读备份。
  • 不移动 OpenClaw 根目录,避免破坏历史脚本和引用路径。