在 GitHub 上传文件时,单个文件不允许超过 100m,超过的话需要使用 Git Large File Storage,操作起来稍有些复杂,而且我记得也有限制。在这里我们可以将大文件压缩并切片,使之被分割为多个小文件,再上传 GitHub,下载之后再合并即可。

  • 压缩

    假设有个大文件 CAZy.faa ,原始大小为 725m,压缩后为 135m,因此我们可以将其压缩为 2~3 个文件 即可避免 100m 的限制。建议上传至 GitHub 的单个文件大小不要超过 50m,因此我们以 50m 为阈值对文件进行切割(参数 - b)。

    tar czf - CAZy.faa | split -b 50m - CAZy.faa.tar.gz

    运行命令后,得到了 3 个文件:CAZy.faa.tar.gzaa,CAZy.faa.tar.gzab,CAZy.faa.tar.gzac。

  • 解压

    通过如下命令解压后可以得到完整的 CAZy.faa 文件。

    cat CAZy.faa.tar.gz* | tar -xzv
  • 在 Windows 下解压

    # 先合并,再用压缩软件解压
    ## 按 “win+r” 键,在弹出的输入框中输入 “cmd” 进入 windows 下的命令提示符界面。切换路径,如进入 F 盘,直接输入 “F:”,再进入 F 盘的 xin 文件夹输入 “cd xin”,输入以下命令进行合并(注意,用的是 cmd 而不是 powershell):
    copy /b CAZy.faa.tar.gza* CAZy.faa.tar.gz

# 参考

  • Linux 下将一个文件压缩分包成多个小文件
Edited on Views times

Give me a cup of [coffee]~( ̄▽ ̄)~*

Hualin Liu WeChat Pay

WeChat Pay

Hualin Liu Alipay

Alipay