2.9k words 3 mins.

# 前言 从 2014 年 6 月 10 日发表的第一篇推文到现在,已经走过了 9 个年头,粉丝也过千了,1150 个粉丝看起来少之又少,但对于一个由个人维护的公众号来说,足够了,人不在多,只要它能帮助到几位、几十位有需求的人就足够了。 本号最初是我读博期间创建的。当时为了做实验室一项科研活动志愿者招募的宣传,需要有一个公众号,而实验室无法以组织身份申请公众号(无公章),因此我以个人身份申请后作为实验室相关活动宣传的窗口。当然,从建号开始到 2021 年 7 月,该号只用来发过数条通知,可谓长期处于休眠模式。当然也靠着实验室的宣传,本号积攒了小几百号粉丝。 我自从 2012...
14k words 13 mins.

# 前言 微生物组 分析描述了复杂微生物群落的动态特征,从而为研究微生物图谱与人类疾病 [1–3] 之间的关系提供了机会。 机器学习 (ML)算法揭示了不同状态下微生物组特征的独特模式,从而促进了基于微生物组的疾病检测和治疗 [8–10]。作为机器学习的一项重要技术,监督分类已被广泛应用于 炎症性肠病(IBD) [11,12]、 癌症 [13,14]、 糖尿病 [15]、 牙龈炎 [16,17] 等疾病的预测。 通过使用来自患者及其健康对照的分类学或功能轮廓作为训练数据来构建分类器和模型,ML 分类器可据此推断新样本的状态(健康 / 疾病)。此外,一些 ML...
1.1k words 1 mins.

# 安装 Python 及依赖包 # python 下载安装 windows 用户请到 Python 官网 https://www.python.org/downloads 下载相应的版本,本教程在 version 3.10.0 测试可行,建议安装 3.7 以上版本。 Linux 系统自带 python,一般不需单独安装,除非版本太低,则需升级。 # 依赖包安装 # BeautifulSoup 以下命令可以在 Windows 中的 CMD/Powershell 或 Linux 终端中运行。 pip install BeautifulSoup4 # requests pip...
31k words 28 mins.

# 代谢组学常用仪器特点 仪器 特点 GC-MS 易挥发,低极性,热稳定的小分子化合物;需衍生化 LC-MS 具有一定极性的有机化合物;无需衍生化 NMR 无偏性,无损检测;•无需繁琐前处理,便于活体、原位的动态检测 CE-MS 高极性化合物,如核酸,蛋白等 ICP-MS 无机化合物 # LC-QTOF 原理 Q-TOF 全称为四极飞行时间质谱仪(Quadrupole Time-of-Flight Mass Spectrometer)。其基本原理是将样品离子通过四极杆进行质量筛选,然后进入飞行时间质谱器(Time-of-Flight Mass...
2.4k words 2 mins.

# 安装 metid 包能够用于 in-house 代谢物库构建,并可利用 MS2 spectra 进行代谢物鉴定。metid 自带数据库,来自于公共数据库的整合。 if(!require(remotes)){install.packages("remotes")}remotes::install_github("tidymass/metid") # 建库 # 构建内部库 # 质谱数据准备 将标准品原始质谱数据用 ProteoWizard 转换为 mzXM 格式. # 标准品信息表 将标准品信息整理至 csv...
30k words 28 mins.

# 介绍 本文档描述了 xcms(version>=3)的 LCMS 实验的数据导入、探索、预处理和分析。示例和基本工作流程改编自 Colin A.Smith 的原始 LC/MS 预处理和分析。 新版本使用 XCMSnExpe 对象(而不是旧的 xcmsSet 对象)作为预处理结果的容器。然而,为了支持依赖于 xcmsSet 对象的包和管道,可以使用 as 方法(即 xset<-as (x, "xcmsSet"))将 XCMSnExpe 转换为 xcmsSet 对象,其中 x 是 XCMSnxp 对象。 # 安装 if...
715 words 1 mins.

# 软件安装 # MZconvert 下载 ProteoWizard 项目下的 Linux native 64-bit,上传至服务器并解压缩 (会将所有文件解压至当前目录,建议提前单独建一个目录),解压后的文件即为可执行程序,需将该目录写入环境变量。 tar jxvf pwiz-bin-linux-x86_64-gcc7-release-3_0_23032_0cc4840.tar.bz2注:在运行 msconvert 时,如果遇到报错 terminate called after throwing an instance of 'std::runtime_error' ,...
1.3k words 1 mins.

# 下载有 summary 的基因组 在 NCBI 基因组数据库搜索物种 下载元数据 获取下载链接 打开下载的元数据文件 prokaryotes.csv (该文件也可以直接去 NCBI FTP 中下载,一般在各物种的目录下,名字为 assembly_summary.txt ,其格式与 prokaryotes.csv 略有不同,但都含有链接),将倒数第二列或最后一列的链接拷贝到 TXT 文本文档中,在每一行的最后加上要下载的文件名和数据类型: 基因组:文件名 _genomic.fna.gz 蛋白序列:文件名 _protein.faa.gz CDs 序列:文件名...
798 words 1 mins.

# 使用场景 假设有一个 fasta 格式的序列文件 SRR9620252.faa ,我们想要提取其中的一些序列到一个新的文件中,我们拥有这些序列的 id (假设这些 id 存放在文件 ids.txt 中)。常规操作的话,可以复制 id,在 fasta 文件中打开搜索,粘贴 id,点击查找,复制找到的序列,粘贴到新的文件中(假设为 Seqout.fasta )。假如你只找一条序列,1 min 之内可以完成,假如你要找 100 条序列,1 h 可能没了。而用 PGCGAP 可以在 1 min 之内完成,剩下的 59 min 可以喝喝茶。 # 使用方法 # PGCGAP 安装 参考官网,需要版本...