XiaoHanys

单细胞数据如何绘制stacked violin?

Python的Scanpy包和Seurat包一样，是单细胞数据处理的利器，其中，Scanpy中有一种堆积的小提琴图，可以很好的展示marker的表达情况，但是在Seurat中并没有内置命令。因此，我自己尝试提取数据并用ggplot2包来画该图。

首先来展示以下画图的成果，如图

2024-09-20 生物信息

阅读全文

使用R语言实现bedtools求交集的功能?

Bedtools作为基因组研究的 “ 瑞士军刀 ”，功能强大且易于操作，是生信行业不可多得的好软件。通常对bed区间的注释，我们使用其中“ 求交集 ”的功能（bedtools intersect) ，但是有一个很不方便的地方，我们通常要生成对应的bed文件，再注释完成后还需要用R语言等读入才能继续分析，所以整合度不是很好，本文希望提供R语言的思路来解决该问题。

2024-09-20 编程语言

阅读全文

Julia短小代码批量检测BAM文件的完整性

我们在运行bwa mem比对的时候，由于某些不明的原因会造成程序中断，例如内存超了，IO错误，计算节点崩溃等，然而BAM是否完整很难察觉，最终导致后续流程无法运行。这里，我们通过一段简短的代码来检查BAM文件的完整性，代码如下：

2024-09-20 编程语言

阅读全文

julia计算为ASCAT创建GC矫正文件

如题，官方已经提供了一个R的版本createGCcontentFile.R ，但是根据代码就能看出这个版本非常占内存了，首先要把基因组整个序列都load入内存中去，每次计算出的矫正数据也是储存dataframe中。为了降低内存占用，也为了提高计算速度，我写了一个julia版本的。代码如下：

2024-09-20 编程语言

阅读全文

用julia语言计算测序数据的Insert Size?

Julia读取BAM的库

想要计算Insert size，需要提供一个基因组比对后的文件，sam也好，bam也罢。那么，使用julia语言计算该值的第一步便是了解如何读取和解析BAM文件格式。

2024-09-20 编程语言

阅读全文

julia本身是一门很快速的语言，但是现代计算机往往具有多核心多线程设计，因此，充分发挥硬件，能进一步提高效率多线程的启动 julia从1.5开始新添加了命令行参数-t num_procs，例如，你想启动一个10个线程的julia，那么就可以执行： julia -t 10 进入REPL后，可以查看当前线程数： Threads.nthreads() 10 如何多线程？ julia提供了一个简单...

2024-09-20 编程语言

阅读全文