技术栈
生物信息学
qq_27390023
1 小时前
python
·
生物信息学
解析TMalign文本文件中的转换矩阵
TM-align 将两个蛋白质结构通过旋转和位移对齐后:输出转换矩阵,文件内容为:解析为numpy array代码
qq_27390023
8 天前
python
·
生物信息学
python划分CSV格式的数据集
编写一个 Python 函数,将 clusters.csv 文件,格式为:第一列为编号,第二列为聚类的代表序列,第三列为所有的其它同源序列,逗号隔开(TM-align蛋白质聚类数据格式转化-CSDN博客),划分为 train, valid, 和 test 数据集。通常,我们可以根据一定的比例(比如 70% 用于 train,15% 用于 valid,15% 用于 test)进行划分。
qq_27390023
13 天前
python
·
生物信息学
biopython提取.cif文件的变换矩阵
蛋白质符合体结构中包含旋转矩阵和平移向量信息。要从 .mmCIF 文件中提取变换矩阵,可以解析文件中存储的 struct_oper 列表。.mmCIF 文件通常包含变换矩阵用于描述不同生物学组装、对称操作等。变换矩阵的信息通常存储在 _pdbx_struct_oper_list 标签下,例如 _pdbx_struct_oper_list.matrix[1][1] 对应矩阵的某个元素。
qq_27390023
19 天前
python
·
生物信息学
构建蛋白质复合体结构中所有链序列的同源性矩阵
为了生成蛋白质复合体结构中所有链之间的同源性矩阵,我们可以使用基于结构比对的工具(如 TM-align),逐对地比对所有链,并根据比对结果(通常是 TM-score)构建同源性矩阵。
qq_27390023
22 天前
python
·
生物信息学
提取蛋白质复合体结构中组装体的变换矩阵
PDB文件中,组装体变换矩阵(assembly transformation matrices)用于描述多聚体结构中各个单体之间的相对位置和取向。从蛋白质复合体 PDB 数据中提取每个组装体(assembly)的变换矩阵,通常需要解析 PDB 文件中包含的组装体信息。这些信息存储在 PDB 文件的 REMARK 350 字段中,该字段描述了如何通过旋转和平移操作将不同的链组合成蛋白质复合体。
生信圆桌
1 个月前
生物信息学
·
基因组学
·
蛋白质组学
·
转录组学
生信是什么?生物信息学的基础概念与应用领域-生信圆桌
生信,全称为生物信息学(Bioinformatics),是指将计算机科学、数学和统计学的方法应用于生物学数据的处理、分析和解释。随着基因组测序技术的发展和大规模生物数据的产生,生物信息学成为了生命科学研究中的一个核心领域。它通过整合和分析大量的生物数据,揭示基因组、蛋白质、代谢物等生物分子的复杂关系,从而推动医学、农业、环境科学等多个领域的进步。
小杜的生信筆記
1 个月前
linux
·
开发语言
·
r语言
·
生物信息学
·
r语言绘图
R语言绘图系列专栏 | 更新中
关于**《R语言绘图专栏》**,此专栏基于R语言绘制图形。每个图形我们会提供对应的R代码、数据和文本文档。此系列将会是一个长期更新的系列。
qq_27390023
1 个月前
java
·
生物信息学
GATK ReadsPathDataSource类介绍
GATK(Genome Analysis Toolkit)是一个广泛使用的基因组分析工具包,它的核心库之一是htsjdk,用于处理高通量测序数据。在GATK中,ReadsPathDataSource类是负责管理和提供读取高通量测序数据文件(如BAM、SAM、CRAM)的类。
qq_27390023
1 个月前
java
·
生物信息学
GATK AlleleList接口介绍
在 GATK(Genome Analysis Toolkit)中,AlleleList 接口是一个用来表示等位基因(alleles)列表的接口。Allele 是遗传学中用于表示某一特定基因座的不同形式的一个基本单位。AlleleList 接口定义了一些操作,使得处理和访问一组等位基因更加方便。
易基因科技
2 个月前
经验分享
·
数据挖掘
·
生物学
·
生物信息学
易基因:RNA修饰N4-乙酰胞苷(ac4C)的调控机制、检测方法及其在癌症中的作用最新研究进展|新方向
大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。N4-乙酰胞苷(ac4C)是一种高度保守的化学修饰,广泛存在于真核和原核生物RNA中,如tRNA、rRNA和mRNA。这种修饰与多种人类疾病显著相关,尤其是癌症,其形成主要依赖于N-乙酰转移酶10(NAT10)(唯一已知ac4C的writer蛋白)的催化活性。本文讨论了ac4C的检测技术及其调控机制,并总结了ac4C与肿瘤发生、发展、预后和药物治疗的相关性。此外还对早期肿瘤诊断和预后预测的新生物标志物以及肿瘤治疗的新靶点进行了评论。
相遂
2 个月前
生物信息学
比较基因组学流程
OrthoFinder是一种快速、准确和全面的比较基因组学分析工具。它可以找到直系和正群,为所有的正群推断基因树,并为所分析的物种推断一个有根的物种树。OrthoFinder还为比较基因组分析提供全面的统计数据。OrthoFinder使用简单,只需运行一组FASTA格式的蛋白质序列文件(每个物种一个)。
cqbzcsq
2 个月前
数据库
·
selenium
·
生物信息学
·
alphafold
使用Selenium爬虫批量下载AlphaFold数据库中的PDB文件
注意:本方法使用了python,下载速度一般,如果需要更快的大批量下载可以考虑使用其他方法,例如FTP
小杜的生信筆記
3 个月前
柱状图
·
生物信息学
·
显著性
·
r语言绘图
·
数值显示
R语言 | 使用ggplot绘制柱状图,在柱子中显示数值和显著性
获得本期教程示例数据,后台回复关键词:20240628。(PS:在社群中,可获得往期和未来教程所有数据和代码)
易基因科技
5 个月前
经验分享
·
生物信息学
易基因: WGBS等揭示梨驯化和改良过程中DNA甲基化对果实成熟的作用机制 | 作物育种
大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。梨(Pyrus ssp.,蔷薇科杏仁核亚科)是世界上最重要的温带水果作物之一。与野生梨相比,栽培梨的果实在许多形态特征上表现出显著变化,包括果实大小、含糖量和核细胞含量。野生梨和栽培梨之间的比较分析可以深入了解关键表型变化的演变。DNA甲基化是一种重要的可遗传表观遗传学标记,可以改变基因组区域可及性,抑制或激活基因表达,最终导致表型变化。然而,表观等位基因在多年生果树驯化中的重要性尚待发现。
小杜的生信筆記
5 个月前
柱状图
·
生物信息学
·
r语言绘图
·
堆积柱状图
·
截断图
截断堆积柱状图
欢迎大家转载!!!!堆积柱状图是柱状图的常见类型之一,也是平时使用概率较高的图形之一。我们前期发布了很多个柱状图的绘制教程,若你刚兴趣可以自行查看。堆积柱状图,最近也发布了一个相对详细的教程,基于R语言 | 绘制个性化堆积柱状图。
小杜的生信筆記
6 个月前
开发语言
·
r语言
·
生物信息学
·
基因组组
·
转录组
·
生物信息学分析
R语言,数据类型转换
今天是4月份的第一天,再过2天后再一次迎来清明小假期。木鸡大家是否正常放假呢?我们在使用R语言做数据分析时,会一直对数据进行不同类型的转换,有时候会被自己弄晕掉,那么就只能一次一次的去解决,去寻找,去学习相关的知识点。
小杜的生信筆記
6 个月前
r语言
·
生物信息学
·
数据转换
·
基因组组
·
转录组
·
参考基因组
·
生物信息学分析
R语言技能 | 不同数据类型的转换
今天是4月份的第一天,再过2天后再一次迎来清明小假期。木鸡大家是否正常放假呢?我们在使用R语言做数据分析时,会一直对数据进行不同类型的转换,有时候会被自己弄晕掉,那么就只能一次一次的去解决,去寻找,去学习相关的知识点。
小杜的生信筆記
7 个月前
r语言
·
生物信息学
·
组学
·
r语言绘图
·
kegg
·
桑基图
·
功能富集分析
R语言图形绘制 | 桑基图绘制教程
在昨天3月10日,我们在知乎、B站等分享了功能富集桑基气泡图的绘制教程。相关链接:NC|高颜值功能富集桑基气泡图,桑基气泡组合图。
易基因科技
7 个月前
经验分享
·
数据挖掘
·
生物学
·
生物信息学
易基因:NAR:RCMS编辑系统在特定细胞RNA位点的靶向m5C甲基化和去甲基化研究|项目文章
喜讯!易基因表观转录组学RNA-BS技术服务见刊《核酸研究》大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。
愿航
8 个月前
生物信息学
肺癌相关文献6
Classification of lung adenocarcinoma based on stemness scores in bulk and single cell transcriptomes IF:6.0 中科院分区:2区 生物学WOS分区:Q1被引次数: 4 背景:癌细胞具有无限期自我更新和增殖的能力[2]。在一部分癌细胞中获得干细胞样特征可促进细胞的持续增殖和去分化。此外,消除非干细胞但不消除干细胞可赋予癌症抗性和复发性。干细胞样和非干细胞样癌细胞的混合赋予肿瘤内异质性 (ITH)。此外,