生物信息学

tRNA做科研20 天前
linux·服务器·conda·生物信息学·生物信息·计算生物学·基因组
最新保姆级Linux下安装与使用conda:从下载配置到使用全流程目录1.前言2.什么是conda3.miniconda和anaconda的对比与选择4.安装前需要确认的东西(非常重要)
18kkk20 天前
学习·r语言·生物信息学
R语言实用技巧--用get函数配合dplyr包传参使用场景,今天在做cellchat,需要提取一下几种细胞类型的id。目前的设置是这样。如果正常写代码传参是这样
鸡鸭扣25 天前
glide·生物信息学·生信·分子对接·薛定谔·网络药理学·maestro
网络药理学之薛定谔Schrödinge Maestro:6、分子对接(Glide、Ligand docking)和可视化本人是win11,薛定谔版本是12.9。 官网:https://www.schrodinger.com/ 本篇文章的示例大分子蛋白PDB ID为4KNN,小分子配体的MOL ID为MOL004004。 本文部分图源来自知乎https://zhuanlan.zhihu.com/p/416698194,推荐为原作者贡献阅读量捏。
鸡鸭扣1 个月前
生物信息学·r·生信·rstudio
生信:TCGA学习(R、RStudio安装与下载、常用语法与常用快捷键)macOS系统,已安装homebrew且会相关命令。近期在整理草稿区,所以放出该贴。官网地址:https://posit.co/download/rstudio-desktop/
qq_273900232 个月前
python·线性代数·矩阵·生物信息学
PSI-BLAST位点特异性矩阵PSSM和ProteinMPNN中氨基酸顺序映射先创建一个 permutation_matrix,以便将PSI-BLAST输出结果PSSM文件中 input_alphabet 中的氨基酸顺序映射到 mpnn_alphabet 中。然后使用这个矩阵将 来自PSI-BLAST的pssm_log_odds 中的数据重新排列,以匹配 mpnn_alphabet 的顺序。
99WOODYXIN2 个月前
生物信息学
bioinformatics 生物信息学个人相关资料收集欧洲生物信息研究所(EMBL-EBI,全称EMBL - European Bioinformatics Institute) 美国国家生物技术信息中心(NCBI) 日本DNA数据库(DDBJ) 中国国家基因库(CNGB)
易基因科技2 个月前
经验分享·数据挖掘·生物学·生物信息学
易基因:Nat Commun:ATAC-seq等揭示恒河猴大脑高分辨率解剖区域的转录组和开放染色质图谱大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。恒河猴是神经科学研究中常用的模型动物,其大脑结构和功能与人类大脑相似。大脑中复杂的遗传网络是灵长类动物行为、认知和情感的基础,一直是神经科学的核心。大脑的综合转录组图谱是更深入地了解大脑功能的关键,这将有助于神经系统疾病研究。
qq_273900233 个月前
python·生物信息学
解析TMalign文本文件中的转换矩阵TM-align 将两个蛋白质结构通过旋转和位移对齐后:输出转换矩阵,文件内容为:解析为numpy array代码
qq_273900233 个月前
python·生物信息学
python划分CSV格式的数据集编写一个 Python 函数,将 clusters.csv 文件,格式为:第一列为编号,第二列为聚类的代表序列,第三列为所有的其它同源序列,逗号隔开(TM-align蛋白质聚类数据格式转化-CSDN博客),划分为 train, valid, 和 test 数据集。通常,我们可以根据一定的比例(比如 70% 用于 train,15% 用于 valid,15% 用于 test)进行划分。
qq_273900233 个月前
python·生物信息学
biopython提取.cif文件的变换矩阵蛋白质符合体结构中包含旋转矩阵和平移向量信息。要从 .mmCIF 文件中提取变换矩阵,可以解析文件中存储的 struct_oper 列表。.mmCIF 文件通常包含变换矩阵用于描述不同生物学组装、对称操作等。变换矩阵的信息通常存储在 _pdbx_struct_oper_list 标签下,例如 _pdbx_struct_oper_list.matrix[1][1] 对应矩阵的某个元素。
qq_273900233 个月前
python·生物信息学
构建蛋白质复合体结构中所有链序列的同源性矩阵为了生成蛋白质复合体结构中所有链之间的同源性矩阵,我们可以使用基于结构比对的工具(如 TM-align),逐对地比对所有链,并根据比对结果(通常是 TM-score)构建同源性矩阵。
qq_273900233 个月前
python·生物信息学
提取蛋白质复合体结构中组装体的变换矩阵PDB文件中,组装体变换矩阵(assembly transformation matrices)用于描述多聚体结构中各个单体之间的相对位置和取向。从蛋白质复合体 PDB 数据中提取每个组装体(assembly)的变换矩阵,通常需要解析 PDB 文件中包含的组装体信息。这些信息存储在 PDB 文件的 REMARK 350 字段中,该字段描述了如何通过旋转和平移操作将不同的链组合成蛋白质复合体。
生信圆桌4 个月前
生物信息学·基因组学·蛋白质组学·转录组学
生信是什么?生物信息学的基础概念与应用领域-生信圆桌生信,全称为生物信息学(Bioinformatics),是指将计算机科学、数学和统计学的方法应用于生物学数据的处理、分析和解释。随着基因组测序技术的发展和大规模生物数据的产生,生物信息学成为了生命科学研究中的一个核心领域。它通过整合和分析大量的生物数据,揭示基因组、蛋白质、代谢物等生物分子的复杂关系,从而推动医学、农业、环境科学等多个领域的进步。
小杜的生信筆記4 个月前
linux·开发语言·r语言·生物信息学·r语言绘图
R语言绘图系列专栏 | 更新中关于**《R语言绘图专栏》**,此专栏基于R语言绘制图形。每个图形我们会提供对应的R代码、数据和文本文档。此系列将会是一个长期更新的系列。
qq_273900234 个月前
java·生物信息学
GATK ReadsPathDataSource类介绍GATK(Genome Analysis Toolkit)是一个广泛使用的基因组分析工具包,它的核心库之一是htsjdk,用于处理高通量测序数据。在GATK中,ReadsPathDataSource类是负责管理和提供读取高通量测序数据文件(如BAM、SAM、CRAM)的类。
qq_273900234 个月前
java·生物信息学
GATK AlleleList接口介绍在 GATK(Genome Analysis Toolkit)中,AlleleList 接口是一个用来表示等位基因(alleles)列表的接口。Allele 是遗传学中用于表示某一特定基因座的不同形式的一个基本单位。AlleleList 接口定义了一些操作,使得处理和访问一组等位基因更加方便。
易基因科技4 个月前
经验分享·数据挖掘·生物学·生物信息学
易基因:RNA修饰N4-乙酰胞苷(ac4C)的调控机制、检测方法及其在癌症中的作用最新研究进展|新方向大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。N4-乙酰胞苷(ac4C)是一种高度保守的化学修饰,广泛存在于真核和原核生物RNA中,如tRNA、rRNA和mRNA。这种修饰与多种人类疾病显著相关,尤其是癌症,其形成主要依赖于N-乙酰转移酶10(NAT10)(唯一已知ac4C的writer蛋白)的催化活性。本文讨论了ac4C的检测技术及其调控机制,并总结了ac4C与肿瘤发生、发展、预后和药物治疗的相关性。此外还对早期肿瘤诊断和预后预测的新生物标志物以及肿瘤治疗的新靶点进行了评论。
相遂5 个月前
生物信息学
比较基因组学流程OrthoFinder是一种快速、准确和全面的比较基因组学分析工具。它可以找到直系和正群,为所有的正群推断基因树,并为所分析的物种推断一个有根的物种树。OrthoFinder还为比较基因组分析提供全面的统计数据。OrthoFinder使用简单,只需运行一组FASTA格式的蛋白质序列文件(每个物种一个)。
cqbzcsq5 个月前
数据库·selenium·生物信息学·alphafold
使用Selenium爬虫批量下载AlphaFold数据库中的PDB文件注意:本方法使用了python,下载速度一般,如果需要更快的大批量下载可以考虑使用其他方法,例如FTP
小杜的生信筆記6 个月前
柱状图·生物信息学·显著性·r语言绘图·数值显示
R语言 | 使用ggplot绘制柱状图,在柱子中显示数值和显著性获得本期教程示例数据,后台回复关键词:20240628。(PS:在社群中,可获得往期和未来教程所有数据和代码)