热点新闻
【小工具】智能合并测序数据fastq的脚本
2023-08-12 17:25  浏览:802  搜索引擎搜索“爱农网”
温馨提示:信息一旦丢失不一定找得到,请务必收藏信息以备急用!本站所有信息均是注册会员发布如遇到侵权请联系文章中的联系方式或客服删除!
联系我时,请说明是在爱农网看到的信息,谢谢。
展会发布 发布信息 广告合作 软文发布

介绍:

这是一个可以自动合并数据的简易脚本

应用场景:

有一批数据有三十几个样本,测序公司返回数据时由于数据量不达标,需要加测一次,部分样本数据量还是不够, 又加测一次才够,总共三次数据,需要根据样本名称合并成一个fq.gz。这么多数据要一个一个对应太麻烦了.

那么如果经常发生这种情况,建议换一家测序公司。

脚本使用注意事项:

批次之间的文件如何区分:

通常是根据lane号区分的,比如:

  • XXX_L3_1.fq.gz(第一批测序回来的)
  • XXX_L2_1.fq.gz(第二批测序回来的)

再有就是两批数据完全相同的名称:

  • XXX_L3_1.fq.gz(第一批测序回来的)
  • XXX_L3_1.fq.gz(第二批测序回来的)

这两种都支持!

脚本的使用:

只需要放入需要合并的数据的所有路径,有多少批数据路径就放多少批数据路径:

./DataMerge.py /path/to/data1 /path/to/data2 /path/to/data3

特此说明:由于脚本是打包了环境的,所以是一个二进制文件,直接使用就行,不用再安装python所需依赖包。遇到permission denied时:chmod 755 /path/to/data_merge/dist/DataMerge

已更新:

  • 支持相对路径
  • 结果不会替换原来的文件,而是生成新的文件夹:
  • 会检查每个路径的fastq数量,并根据fastq名称一一对应.
  • 支持10x数据的-1,-2,-3,-4的数据:
  • 所有的数据一个都不漏,该合并的合并,不需要合并的就链接地址过来.

待更新:

SE的数据没有验证过,

举例:

./DataMerge.py ../20220331_HG5GLDSX3_Result/Rawdata ../20220404_HFVV3DSX3_Result/Rawdata

点赞+评论获取脚本

发布人:3278****    IP:117.173.23.***     举报/删稿
展会推荐
让朕来说2句
评论
收藏
点赞
转发