生物信息学

Solyn_HAN6 天前
生物信息学
生信项目管理与版本控制进阶:Git Flow+Zenodo+ReadMe 规范(科研项目可复现实操)生信研究的核心是 “可复现性”—— 无论是团队内部协作、新人接手项目,还是投稿时满足期刊的可复现要求,混乱的项目管理都会导致 “代码改一版丢一版、数据版本不匹配、分析结果无法追溯” 的困境。更关键的是,基金申报(如 NSFC)和顶级期刊(如 Nature/Science 子刊)越来越强调 “数据与代码的可访问性、版本的可追溯性”,传统的 “本地文件夹命名 v1/v2/v3”“邮件传输脚本” 的方式早已无法满足科研规范。
Solyn_HAN6 天前
python·bash·生物信息学·r
非编码 RNA(ceRNA/lncRNA/circRNA)分析完整流程:从数据下载到功能验证(含代码模板)非编码 RNA(ncRNA)是基因组中不编码蛋白质的 RNA 分子,其中 lncRNA(长链非编码 RNA)、circRNA(环状 RNA)及由其构成的 ceRNA(内源竞争 RNA)网络,已成为肿瘤发生发展、代谢调控、免疫应答等领域的研究热点。不同于编码基因分析,ncRNA 具有 “序列保守性低、功能机制复杂、依赖调控网络解析” 的特点,需一套从数据获取到实验验证的完整分析体系。
Solyn_HAN7 天前
生物信息学
多组学可视化进阶:OmicsDashboard 搭建与交互式报告生成(R Shiny/Python Dash 实战)多组学研究(转录组 + 蛋白组 + 代谢组 + 甲基化组等)已成为解析生物复杂调控机制的核心手段,但数据可视化始终是制约多组学成果落地的关键瓶颈:传统静态图表(如 ggplot2 绘制的热图、火山图)无法支持非生信人员的交互式探索,多组学数据整合后维度高达数千甚至数万,静态图表难以展现全局关联;投稿 / 项目汇报时,静态报告无法让评审 / 团队成员自主筛选感兴趣的分子、调整可视化参数,导致研究价值无法充分呈现。
Solyn_HAN9 天前
生物信息学·snakemake
Snakemake 从入门到实战:生信自动化工作流搭建指南随着高通量测序技术的飞速发展,生物信息学领域的数据量呈指数级增长。数据分析流程通常涵盖测序数据清洗、比对、变异检测、表达分析等数十个相互关联的复杂步骤。过去,科研人员依赖手动执行脚本完成分析,不仅效率低下、耗费大量精力,还易因运行环境差异(比如操作系统版本差异、软件版本不同)导致结果不可重复,给严谨的科学研究带来巨大挑战。
Solyn_HAN10 天前
python·生物信息学·biopython
Python 生信进阶:Biopython 库完全指南(序列处理 + 数据库交互)一、引言:Biopython—— 生信分析的 Python 瑞士军刀在生物信息学研究中,科研人员常面临三大核心痛点:数据格式碎片化(FASTA/FASTQ/GenBank/GFF 等 20 + 格式并存)、批量处理效率低(动辄 GB 级测序数据、数千条序列)、数据库交互繁琐(NCBI/PubMed 等资源检索需手动下载或复杂接口调用)。传统分析流程依赖 Perl 脚本或命令行工具拼接,不仅代码可读性差,还难以适配多样化的分析需求。
橙子牛奶糖25 天前
gwas·生物信息学·单细胞测序
Nature | 本周最新文献速递文章标题: A pangenome and pantranscriptome of hexaploid oat
陈天白2 个月前
r语言·生物信息学·rna-seq
RNA-seq分析之最佳cutoff(TCGA版)原理是依据生存数据来区分基因高低表达的阈值,用来判别基因高表达组和低表达组挺好用的,还有个数据库专门做这个PrognoScan: A new database for meta-analysis of the prognostic value of genes.
这是一只菜狗啊4 个月前
生物信息学
链特异性文库是什么?为什么它在转录组测序中越来越重要?在现代分子生物学研究中,RNA测序(RNA-seq) 是一种广泛应用的技术,用于分析基因在不同条件下的表达情况。而在RNA-seq的众多技术细节中,有一个“隐秘但关键”的环节——链特异性文库构建(Strand-specific library preparation)。这项技术虽然听起来有些专业,但它对结果的准确性有着重要影响。本文将通俗地介绍链特异性文库的原理、作用、常见方法及数据分析注意事项。
让学习成为一种生活方式4 个月前
生物信息学
生物信息学数据技能-学习系列001本系列是我两年前问自己的一个问题的答案:“当我开始接触生物信息学时,我最想读哪本书?”当我开始从事这个领域的工作时,我已经具备了Python和R的编程经验,但其他方面的知识较少。我曾经寻找过一本优秀的生物信息学入门书籍,虽然我找到了一些不错的书籍,但大多数并未针对我作为生物信息学家的日常工作。找到的几本书从理论和算法的角度探讨了生物信息学,涉及了像Smith-Waterman比对、系统发育重建、基序寻找等话题。虽然这些内容很有趣(我也推荐大家深入探索这些材料),但我在日常工作中并不需要从头实现生物信息学算
endNone6 个月前
生物信息学·基因组学·k-mer
【生物信息学】k-mer的基本概念及应用在 Evo 2 论文中,有一张图展示了基于不同物种基因组 K-mer 特征的 UMAP 嵌入结果,因此专门查阅了 K-mer 相关概念以深入了解其含义。
易基因科技7 个月前
经验分享·数据挖掘·生物学·生物信息学·生信分析·基础技术方法论专题
易基因:何川团队开发新m6A测序方法 可温和条件下高分辨率/低背景噪声检测m6A修饰|Nature子刊大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。RNA和DNA中的化学修饰在多种生物过程中发挥着关键作用,包括转录调控、RNA降解、蛋白质翻译和免疫调节等。这些修饰已被新的测序方法以单碱基分辨率定量地绘制出来,其中核苷酸脱氨基是一种高效策略,用于选择性地绘制DNA中的5-甲基胞嘧啶(5-methylcytosine)和RNA中的N6-甲基腺苷(m6A)。然而,传统的化学脱氨基方法依赖于在苛刻的酸性条件下使用芳基重氮盐,这限制了其在大多数生物底物中的应用。近年来,基于亚硝酸盐离子的RNA测序方
lisw057 个月前
生物信息学
生物信息学技能树(Bioinformatics)与学习路径李升伟 整理生物信息学是一门跨学科领域,涉及生物学、计算机科学以及统计学等多个方面。以下是关于生物信息学的学习路径及相关技能的详细介绍。
tRNA做科研8 个月前
开发语言·r语言·生物信息学·bioconductor·biocmanager
通过Bioconductor/BiocManager安装生物r包详解(问题汇总)在日常工作,特别是通过linux服务器安装R包,总是遇到各种问题,如网速问题、版本冲突、依赖问题等等,因此写这篇博客希望能帮助大家。
qq_273900238 个月前
人工智能·pytorch·python·生物信息学
AF3 identity_trans函数解读AlphaFold3 rigid_utils 模块的 identity_trans 函数的功能是生成带有批次维度的全零平移向量张量。
qq_273900239 个月前
人工智能·python·深度学习·生物信息学
AF3 make_msa_mask函数解读AlphaFold3 data_transforms 模块的 make_msa_mask 函数 主要是 为 MSA (多序列比对) 生成初始化的 mask 掩码特征: msa_mask和 msa_row_mask。用于后续的特征处理,确保模型在处理 MSA 时能够识别哪些数据是有效的,哪些需要被忽略(比如填充的 0)。
qq_273900239 个月前
人工智能·pytorch·深度学习·生物信息学
AF3 squeeze_features函数解读AlphaFold3 data_transforms 模块的 squeeze_features 函数的作用去除 蛋白质特征张量中不必要的单维度(singleton dimensions)和重复维度,以使其适配 AlphaFold3 预期的输入格式。
lisw059 个月前
workflow·生物信息学·galaxy
使用Galaxy创建生物信息学工作流的步骤详解李升伟 整理Galaxy 是一个基于 Web 的生物信息学平台,提供了直观的用户界面和丰富的工具,帮助用户创建和管理生物信息学工作流。以下是使用 Galaxy 创建生物信息学工作流的主要步骤:
易基因科技9 个月前
经验分享·数据挖掘·生物学·生物信息学
易基因特异性R-loop检测整体研究方案大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。R-loop是由DNA:RNA 杂交体和被置换的单链DNA组成的三链核酸结构,广泛参与基因转录、表观遗传调控及DNA修复等关键生物学过程。异常的R-loop积累会导致基因组不稳定性,与癌症、神经退行性疾病及自身免疫性疾病密切相关。
易基因科技9 个月前
经验分享·数据挖掘·生物学·生物信息学
易基因: ChIP-seq+DRIP-seq揭示AMPK通过调控H3K4me3沉积和R-loop形成以维持基因组稳定性和生殖细胞完整性|NAR原文:ChIP-seq+DRIP-seq揭示AMPK通过调控H3K4me3沉积和R-loop形成以维持基因组稳定性和生殖细胞完整性|NAR
qq_273900239 个月前
python·生物信息学
Biopython PDB模块的PDBParser和MMCIFParser介绍Biopython 提供了 Bio.PDB 模块,用于解析、操作和分析 PDB 和 mmCIF 结构文件。核心的解析器包括: