发布网友 发布时间:2024-10-23 20:54
共1个回答
热心网友 时间:2024-11-01 11:03
GEO数据库,作为全球基因表达数据的权威存储库,由NCBI创建并维护,网址为ncbi.nlm.nih.gov/geo。它收录了来自全球科研人员的多种高通量基因表达数据,包括微阵列芯片、二代测序等,所有数据均可以免费获取。
GEO的数据组织结构清晰,分为两个子数据库:GEO DataSets以实验数据集为单位,记录一个实验的所有信息;而GEO Profiles则按基因表达谱进行存储,每个基因在数据集中的表现都可查找。数据以五级分类:Platforms(以GPL开头,如GPL570,代表实验平台)、Series(GSE开头,如GSE57,代表完整的实验方案)、Datasets和Profiles(GDS和流水号,如33759453,代表整理后的数据)、以及Samples(GSM开头,如GSM134584,代表实验样本)。并非所有上传数据都会被整理,只有经过官方评估的才会成为GDS或Profiles。
GEO提供丰富的数据类型,包括基因表达、非编码RNA表达、基因组甲基化、变异和单核苷酸多态性数据,以及蛋白微阵列芯片和高通量测序数据(高通量测序原始数据存于SRA,处理后的数据在GSE)。在GEO首页,用户可以根据数据类型和组织结构进行查找,数据可通过网站或FTP下载。使用GEO数据进行研究时,别忘了引用其相关文献。