UniProt里面的亚细胞定位标注部分是有固定的格式可循的。这种格式是可以用正则表达式来标示的。这种可以遵循的格式最早起源于2007-10-23版本。
原始文章如下:(链接:http://www.uniprot.org/help/2007/10/23/release)
Syntax modification of the 'Subcellular location' subtopic We have structured the 'Subcellular location' subtopic (CC SUBCE LLULAR LOCATION lines in th[......]