生物信息学

qq_273900236 天前
人工智能·pytorch·python·生物信息学
AF3 identity_trans函数解读AlphaFold3 rigid_utils 模块的 identity_trans 函数的功能是生成带有批次维度的全零平移向量张量。
qq_2739002319 天前
人工智能·python·深度学习·生物信息学
AF3 make_msa_mask函数解读AlphaFold3 data_transforms 模块的 make_msa_mask 函数 主要是 为 MSA (多序列比对) 生成初始化的 mask 掩码特征: msa_mask和 msa_row_mask。用于后续的特征处理,确保模型在处理 MSA 时能够识别哪些数据是有效的,哪些需要被忽略(比如填充的 0)。
qq_2739002320 天前
人工智能·pytorch·深度学习·生物信息学
AF3 squeeze_features函数解读AlphaFold3 data_transforms 模块的 squeeze_features 函数的作用去除 蛋白质特征张量中不必要的单维度(singleton dimensions)和重复维度,以使其适配 AlphaFold3 预期的输入格式。
lisw0521 天前
workflow·生物信息学·galaxy
使用Galaxy创建生物信息学工作流的步骤详解李升伟 整理Galaxy 是一个基于 Web 的生物信息学平台,提供了直观的用户界面和丰富的工具,帮助用户创建和管理生物信息学工作流。以下是使用 Galaxy 创建生物信息学工作流的主要步骤:
易基因科技22 天前
经验分享·数据挖掘·生物学·生物信息学
易基因特异性R-loop检测整体研究方案大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。R-loop是由DNA:RNA 杂交体和被置换的单链DNA组成的三链核酸结构,广泛参与基因转录、表观遗传调控及DNA修复等关键生物学过程。异常的R-loop积累会导致基因组不稳定性,与癌症、神经退行性疾病及自身免疫性疾病密切相关。
易基因科技1 个月前
经验分享·数据挖掘·生物学·生物信息学
易基因: ChIP-seq+DRIP-seq揭示AMPK通过调控H3K4me3沉积和R-loop形成以维持基因组稳定性和生殖细胞完整性|NAR原文:ChIP-seq+DRIP-seq揭示AMPK通过调控H3K4me3沉积和R-loop形成以维持基因组稳定性和生殖细胞完整性|NAR
qq_273900231 个月前
python·生物信息学
Biopython PDB模块的PDBParser和MMCIFParser介绍Biopython 提供了 Bio.PDB 模块,用于解析、操作和分析 PDB 和 mmCIF 结构文件。核心的解析器包括:
qq_273900232 个月前
人工智能·深度学习·机器学习·生物信息学
AF3 superimpose函数解读AlphaFold3 superimpose函数通过使用SVD最小化RMSD,将坐标叠加到参考上,在蛋白质结构预测中用于比较预测结构与真实结构的相似性。
qq_273900233 个月前
pytorch·python·深度学习·生物信息学
AF3 BaseTriangleMultiplicativeUpdate类解读BaseTriangleMultiplicativeUpdate 类是一个抽象基类 (ABC),用于实现 AlphaFold 相关算法(具体为算法 11 和 12)。它的主要功能是通过三角形乘法更新成对表示张量(pairwise representation tensor)。
tRNA做科研4 个月前
linux·服务器·conda·生物信息学·生物信息·计算生物学·基因组
最新保姆级Linux下安装与使用conda:从下载配置到使用全流程目录1.前言2.什么是conda3.miniconda和anaconda的对比与选择4.安装前需要确认的东西(非常重要)
18kkk4 个月前
学习·r语言·生物信息学
R语言实用技巧--用get函数配合dplyr包传参使用场景,今天在做cellchat,需要提取一下几种细胞类型的id。目前的设置是这样。如果正常写代码传参是这样
鸡鸭扣4 个月前
glide·生物信息学·生信·分子对接·薛定谔·网络药理学·maestro
网络药理学之薛定谔Schrödinge Maestro:6、分子对接(Glide、Ligand docking)和可视化本人是win11,薛定谔版本是12.9。 官网:https://www.schrodinger.com/ 本篇文章的示例大分子蛋白PDB ID为4KNN,小分子配体的MOL ID为MOL004004。 本文部分图源来自知乎https://zhuanlan.zhihu.com/p/416698194,推荐为原作者贡献阅读量捏。
鸡鸭扣5 个月前
生物信息学·r·生信·rstudio
生信:TCGA学习(R、RStudio安装与下载、常用语法与常用快捷键)macOS系统,已安装homebrew且会相关命令。近期在整理草稿区,所以放出该贴。官网地址:https://posit.co/download/rstudio-desktop/
qq_273900235 个月前
python·线性代数·矩阵·生物信息学
PSI-BLAST位点特异性矩阵PSSM和ProteinMPNN中氨基酸顺序映射先创建一个 permutation_matrix,以便将PSI-BLAST输出结果PSSM文件中 input_alphabet 中的氨基酸顺序映射到 mpnn_alphabet 中。然后使用这个矩阵将 来自PSI-BLAST的pssm_log_odds 中的数据重新排列,以匹配 mpnn_alphabet 的顺序。
99WOODYXIN5 个月前
生物信息学
bioinformatics 生物信息学个人相关资料收集欧洲生物信息研究所(EMBL-EBI,全称EMBL - European Bioinformatics Institute) 美国国家生物技术信息中心(NCBI) 日本DNA数据库(DDBJ) 中国国家基因库(CNGB)
易基因科技5 个月前
经验分享·数据挖掘·生物学·生物信息学
易基因:Nat Commun:ATAC-seq等揭示恒河猴大脑高分辨率解剖区域的转录组和开放染色质图谱大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。恒河猴是神经科学研究中常用的模型动物,其大脑结构和功能与人类大脑相似。大脑中复杂的遗传网络是灵长类动物行为、认知和情感的基础,一直是神经科学的核心。大脑的综合转录组图谱是更深入地了解大脑功能的关键,这将有助于神经系统疾病研究。
qq_273900236 个月前
python·生物信息学
解析TMalign文本文件中的转换矩阵TM-align 将两个蛋白质结构通过旋转和位移对齐后:输出转换矩阵,文件内容为:解析为numpy array代码
qq_273900236 个月前
python·生物信息学
python划分CSV格式的数据集编写一个 Python 函数,将 clusters.csv 文件,格式为:第一列为编号,第二列为聚类的代表序列,第三列为所有的其它同源序列,逗号隔开(TM-align蛋白质聚类数据格式转化-CSDN博客),划分为 train, valid, 和 test 数据集。通常,我们可以根据一定的比例(比如 70% 用于 train,15% 用于 valid,15% 用于 test)进行划分。
qq_273900236 个月前
python·生物信息学
biopython提取.cif文件的变换矩阵蛋白质符合体结构中包含旋转矩阵和平移向量信息。要从 .mmCIF 文件中提取变换矩阵,可以解析文件中存储的 struct_oper 列表。.mmCIF 文件通常包含变换矩阵用于描述不同生物学组装、对称操作等。变换矩阵的信息通常存储在 _pdbx_struct_oper_list 标签下,例如 _pdbx_struct_oper_list.matrix[1][1] 对应矩阵的某个元素。
qq_273900236 个月前
python·生物信息学
构建蛋白质复合体结构中所有链序列的同源性矩阵为了生成蛋白质复合体结构中所有链之间的同源性矩阵,我们可以使用基于结构比对的工具(如 TM-align),逐对地比对所有链,并根据比对结果(通常是 TM-score)构建同源性矩阵。