<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title>Nanopore - Tag - Xiaopeng Xu</title><link>https://xu-xp.com/tags/nanopore/</link><description>Nanopore - Tag - Xiaopeng Xu</description><generator>Hugo -- gohugo.io</generator><language>en</language><managingEditor>xiaopeng.xu@kaust.edu.sa (Xiaopeng Xu)</managingEditor><webMaster>xiaopeng.xu@kaust.edu.sa (Xiaopeng Xu)</webMaster><lastBuildDate>Thu, 08 Feb 2024 00:00:00 +0000</lastBuildDate><atom:link href="https://xu-xp.com/tags/nanopore/" rel="self" type="application/rss+xml"/><item><title>Nanopore 分析流程</title><link>https://xu-xp.com/posts/nanopore_data_analysis/</link><pubDate>Thu, 08 Feb 2024 00:00:00 +0000</pubDate><author>xiaopeng.xu@kaust.edu.sa (Xiaopeng Xu)</author><guid>https://xu-xp.com/posts/nanopore_data_analysis/</guid><description><![CDATA[<h2 id="基础的分析流程">基础的分析流程：</h2>
<ol>
<li>
<p>Base calling 从电信号中识别碱基序列。原始电信号是Fast5/Pod5格式，需要转为 Fastq 格式。 Fast5/Pod5-&gt; Fastq。</p>
</li>
<li>
<p>Alignment 比对到参考基因组。常用工具是 minimap2。</p>
</li>
<li>
<p>Call variants 获取突变数据，包括 GATK，VarScan 等。</p>]]></description></item><item><title>Nanopore 信号分析</title><link>https://xu-xp.com/posts/nanopore_signal_analysis/</link><pubDate>Wed, 07 Feb 2024 00:00:00 +0000</pubDate><author>xiaopeng.xu@kaust.edu.sa (Xiaopeng Xu)</author><guid>https://xu-xp.com/posts/nanopore_signal_analysis/</guid><description><![CDATA[<h2 id="原始测序电信号数据格式">原始测序电信号数据格式</h2>
<h3 id="fast5-数据格式">FAST5 数据格式</h3>
<p><a href="https://github.com/nanoporetech/fast5_research" target="_blank" rel="noopener noreffer ">https://github.com/nanoporetech/fast5_research</a></p>
<p><a href="https://blog.csdn.net/Emmett_Bioinfo/article/details/113847543" target="_blank" rel="noopener noreffer ">https://blog.csdn.net/Emmett_Bioinfo/article/details/113847543</a></p>
<p><a href="https://zhuanlan.zhihu.com/p/137069950" target="_blank" rel="noopener noreffer ">https://zhuanlan.zhihu.com/p/137069950</a></p>
<p>FAST5格式（.fast5）实际上是在HDF5格式上的一种变体。HDF是Hierarchical Data Format的首字母缩写，从名字上就可以看出来这种文件格式储存信息的方式是层级嵌套的（hierarchical, nested）。它采用chunking（分解）的方式来存储多维数据，它内部表现出来的是类似于文件夹（树）的结构。由于这种文件层级分解的特性，想要获取某一部分信息，只需要获得该部分信息所在的chunk即可，这样就让这种文件格式非常的flexible，也非常适合用于多种编程语言来处理。FAST5格式是Oxford推出Nanopore测序之后在HDF5格式的基础上设计用于存储Nanopore测序信息的文件。</p>]]></description></item></channel></rss>