王英珍

不积硅步,无以至千里;不积小流,无以成江河

R语言org.Hs.eg.db包的安装过程

11 Jul 2017 »

R org.Hs.eg.db

org.Hs.eg.db介绍

是bioconductor上的一个数据库文件,里边包含着大量的人类基因注释信息,可以进行不同数据库间的ID转换。  
以防翻译不准确,给个官网描述吧:  
org.Mm.egACCNUM is an R object that contains mappings between Entrez Gene identifiers and
GenBank accession numbers.

类似的其他物种数据库有 拟南芥org.At.tair.db小鼠org.Mm.eg.db 等等.

安装

按照官网给的命令安装:

source("https://bioconductor.org/biocLite.R")
biocLite("org.Hs.eg.db")

报错

  1. 一般情况下是没问题的,但是我在安装的时候却报错了,很遗憾没有保存报错信息截图,但我在网上搜了下大概的报错信息和下面的类似:
    1: running command '"D:/Program Files/R/R-3.2.3/bin/x64/R" CMD INSTALL -l "D:\Program Files\R\R-3.2.3\library" C:\Users\Liu\AppData\Local\Temp\RtmpQ9yUYt/downloaded_packages/org.Hs.eg.db_3.2.3.tar.gz' had status 1 
    2: In install.packages(pkgs = doing, lib = lib, ...) :
      installation of package ‘org.Hs.eg.db’ had non-zero exit status
    

后来我发现在前面安装go.db这个包的时候出现了很多乱码,我才明白原来是我R语言的安装路径里存在着中文,所以才造成安装路径错误。然后我就把R卸载掉重新安装在全英文路径下,之后这个问题就解决了。

  1. 然后重新安装的时候又遇到了下面的问题,报错信息如下: tu
 there is no package called 'RSQLite';
 就是这个包没有安装成功呗;那就 install.package("RSQLite");
 之后在CMD命令行里继续安装命令:

OK!DONE!

所以这就提醒我们:

 1.win用户在做生物信息的时候,尽量把文件夹命名成英文的,以免不必要的错误耽搁时间;  
 2.要学会看报错信息,不要被Error、warning这些信息给吓到
 3.善用Google 或 必应搜索

简单使用

1 查看数据类型:keytypes(org.Hs.eg.db)
2 select 函数
    #已知ENTREZID查基因名(SYMBOL)
    gene<-c("3104","3105","3106")#已知三个ENTREZID
    cols<-c("SYMBOL", "GENENAME")
    select(org.Hs.eg.db, keys=gene,columns=cols,keytype="ENTREZID")#查看基因信息
    #已知基因查各种注释信息
    select(org.Hs.eg.db,keys="ZBTB48",c("ENSEMBL","UNIGENE","ENTREZID","CHR","GO","GENENAME"),keytype="SYMBOL")

参考

  1. https://www.biostars.org/p/177945/
  2. http://www.bio-info-trainee.com/710.html

Author: 王英珍
qq: 296085360
email:wangyingzhen91@163.com