R
org.Hs.eg.db
org.Hs.eg.db介绍
是bioconductor上的一个数据库文件,里边包含着大量的人类基因注释信息,可以进行不同数据库间的ID转换。
以防翻译不准确,给个官网描述吧:
org.Mm.egACCNUM is an R object that contains mappings between Entrez Gene identifiers and
GenBank accession numbers.
类似的其他物种数据库有 拟南芥org.At.tair.db , 小鼠org.Mm.eg.db 等等.
安装
按照官网给的命令安装:
source("https://bioconductor.org/biocLite.R")
biocLite("org.Hs.eg.db")
报错
- 一般情况下是没问题的,但是我在安装的时候却报错了,很遗憾没有保存报错信息截图,但我在网上搜了下大概的报错信息和下面的类似:
1: running command '"D:/Program Files/R/R-3.2.3/bin/x64/R" CMD INSTALL -l "D:\Program Files\R\R-3.2.3\library" C:\Users\Liu\AppData\Local\Temp\RtmpQ9yUYt/downloaded_packages/org.Hs.eg.db_3.2.3.tar.gz' had status 1 2: In install.packages(pkgs = doing, lib = lib, ...) : installation of package ‘org.Hs.eg.db’ had non-zero exit status
后来我发现在前面安装go.db这个包的时候出现了很多乱码,我才明白原来是我R语言的安装路径里存在着中文,所以才造成安装路径错误。然后我就把R卸载掉重新安装在全英文路径下,之后这个问题就解决了。
- 然后重新安装的时候又遇到了下面的问题,报错信息如下:
there is no package called 'RSQLite';
就是这个包没有安装成功呗;那就 install.package("RSQLite");
之后在CMD命令行里继续安装命令:
OK!DONE!
所以这就提醒我们:
1.win用户在做生物信息的时候,尽量把文件夹命名成英文的,以免不必要的错误耽搁时间;
2.要学会看报错信息,不要被Error、warning这些信息给吓到
3.善用Google 或 必应搜索
简单使用
1 查看数据类型:keytypes(org.Hs.eg.db) 2 select 函数 #已知ENTREZID查基因名(SYMBOL) gene<-c("3104","3105","3106")#已知三个ENTREZID cols<-c("SYMBOL", "GENENAME") select(org.Hs.eg.db, keys=gene,columns=cols,keytype="ENTREZID")#查看基因信息 #已知基因查各种注释信息 select(org.Hs.eg.db,keys="ZBTB48",c("ENSEMBL","UNIGENE","ENTREZID","CHR","GO","GENENAME"),keytype="SYMBOL")
参考
Author: 王英珍
qq: 296085360
email:wangyingzhen91@163.com