Sticky Posts

33k words 30 mins.

为了方便广大中文用户学习 PGCGAP 的使用,特意书写该中文文档,但中文文档更新较慢,强烈建议大家阅读英文文档!

Categories

Post List

798 words 1 mins.

# 使用场景 假设有一个 fasta 格式的序列文件 SRR9620252.faa ,我们想要提取其中的一些序列到一个新的文件中,我们拥有这些序列的 id (假设这些 id 存放在文件 ids.txt 中)。常规操作的话,可以复制 id,在 fasta 文件中打开搜索,粘贴 id,点击查找,复制找到的序列,粘贴到新的文件中(假设为 Seqout.fasta )。假如你只找一条序列,1 min 之内可以完成,假如你要找 100 条序列,1 h 可能没了。而用 PGCGAP 可以在 1 min 之内完成,剩下的 59 min 可以喝喝茶。 # 使用方法 # PGCGAP 安装 参考官网,需要版本...
2k words 2 mins.

# 升级 WSL 查看已安装的 WSL 版本 (Windows PowerShell 中运行) wsl.exe -l -v 显示如下: NAME STATE VERSION* Ubuntu-20.04 Running 1 docker-desktop-data Stopped 2看到安装的为 WSL1,据说 WSL1 不支持 Docker,所以换成 WSL2,至于 WSL1 和 WSL2 的异同可参考比较 WSL 1 和 WSL 2。 安装 WSL2 (Windows PowerShell 中运行) wsl.exe --set-version ubuntu-20.04...
11k words 10 mins.

# 安装软件 mamba install miniasm minipolish raven-assembler flye medaka python=3.8 fastp bwa masurca trycyclergit clone https://github.com/rrwick/Minipolish.gitgit clone https://github.com/rrwick/Polypolish.gitcd Polypolishsudo apt updatesudo apt install cargocargo build --release# Step 1: Generating...
3.4k words 3 mins.

# EggNOG-mapper 简介 (本文未完待续...) EggNOG-mapper (a.k.a. emapper.py or just emapper) is a tool for fast functional annotation of novel sequences. It uses precomputed orthologous groups (OGs) and phylogenies from the eggNOG database (http://eggnogdb.embl.de/) to transfer functional information from...
792 words 1 mins.

# Geographic Scale Influences the Interactivities Between Determinism and Stochasticity in the Assembly of Sedimentary Microbial Communities on the South China Sea Shelf 投稿过程 # 类型: Artical # 周期: ~4.5 个月 # 节点: First Submission:2021.09.08 分配审稿人:2021.09.14 审稿完毕:2021.09.21 返回修稿意见:2021.10.23...
3.3k words 3 mins.

# 介绍 DeepARG 是一种机器学习解决方案,它使用深度学习来表征和注释宏基因组中的抗生素抗性基因。它由两种输入模型组成:短序列 Reads 和 gene-like 序列。 # 安装软件 通过 conda 安装 # 创建环境conda create -n deeparg_env python=2.7.18conda activate deeparg_env# 安装 diamondconda install -c bioconda diamond==0.9.24# 安装其他依赖conda install trimmomatic vsearch bedtools bowtie2...
4.5k words 4 mins.

# 蛋白质组的全局 pIs 细胞全局蛋白质组 pI 图的变化取决于氨基酸的总电荷,并对蛋白质的结构和特性具有重要意义。 普遍认为原核基因组具有两个最大的双峰形状,一个在酸性 pH 值下主要对应于溶解的蛋白质(细胞质蛋白或分泌蛋白),另一种在膜蛋白的碱性 pH 值下,具有细胞内碱性(带正电荷)结构域以促进质子动力的产生。在这两个峰之间,有一个最小的中性值,对应于细胞内的 pH 值(如下图)。 蛋白质氨基酸组成和 pI 水平的显着变化提供了一种工具来预测培养物或宏基因组组装基因组 (MAG) 的首选栖息地。 Pedro J. et al., 2019, Microbiome # 安装...
7.1k words 6 mins.

GTDB-Tk 是一个软件工具包,用于根据基因组数据库分类 GTDBGenome Database Taxonomy GTDB 为细菌和古菌基因组分配客观分类学分类assigning objective taxonomic classifications。可以用于宏基因组组装基因组 (MAG)、单菌基因组和单细胞基因组。 # 安装 GTDB-Tk 通过 conda 安装主程序 # latest versionconda create -n gtdbtk -c conda-forge -c bioconda gtdbtk# specific version (replace 1.7.0...
12k words 11 mins.

# 安装软件 安装主程序及依赖 VirSorter2 (version >=2.2.3) CheckV (version >=0.7.0) DRAMv (version >=1.2.0) conda create -n virome virsorter=2 checkv dramconda activate virome 下载数据库 # vs2 db: db-vs2 ~ 10 minvirsorter setup -d /new_data/hualin/db/db-vs2 -j 50# checkv db: checkv-db-v1.0...