DNA片段并不都是规规矩矩一样长短的。两段完全一样的DNA片段通常还连着一些不太一样的片段。如果没有测序错误,那么根据这些少许的不同就可以判断出它们是来自于不同区域的重复序列
好像你说的是重复序列边上还带了不一样的片段。不过这种情况下即使有测序错误也没有关系,根据连着的unique sequence就可以确定这个重复序列应该放在哪里。Nature文章指的是怎样处理一段全是重复序列的测序片段。如果有一两个碱基变了,你不知道那个变化是真的还是由于测序错误来的。由于重复序列本身并不是100%保守,所以你无法判断两个有微小差别的测序片段是不是来自不同的DNA片段。