如何在GEO数据库上传原始测序数据RNA-SEQ,学习过程分享!

背景知识
GEO (Gene Expression Omnibus)是一个公共功能基因组学数据存储库,支持符合 MIAME 标准的数据提交。 接受基于阵列和序列的数据。 提供工具来帮助用户查询和下载实验和策划的基因表达谱。基本上文章中原始测序数据都会提交在这个数据库中,所以学会上传自己的数据也是十分重要的。
2 上传步骤
1.登录NCBI(https://www.ncbi.nlm.nih.gov/),在首页点击Submit,准备上传原始测序数据(.fastq.gz文件,是测序原始文件的压缩文件)。
在这里插入图片描述
2.下滑页面,找到Other Tools下面的GEO一栏,点击Learn more
在这里插入图片描述3.点击Sunbmit high-throughput sequencing
在这里插入图片描述
4.点击Raw data files
在这里插入图片描述
5.上传数据分为两步,页面往下滑动,先选择Transfer Files
在这里插入图片描述6.登录NCBI账号(需要自己注册)
上传数据是会要求填入自己的邮件,工作单位和地址等信息。
在这里插入图片描述
7.上传数据,Step1提供了文件上传地址,Step2提供了FTP服务器的地址,账号和密码。
在这里插入图片描述
8.选择远程登录FTP服务器软件filezilla并上传测序文件
在给定的上传文件夹中新建一个文件夹(命名规则:geo_submission_month&day),并把测序原始文件从上传到此文件夹中。eg:geo_submission_feb22
注意:右侧的uploads/…需要按回车的,我还查了半天,以为我的filezilla有问题。。。。。哈哈哈,愚蠢的错误
【正在进行中,这一步十分漫长。2个小时两个文件的龟速。。。】
今晚放这上传,如果明天还很慢,再想办法服务器传输,今天试了conda下载安装lftp,好像不太行,可能我不太会弄,哈哈哈。
在这里插入图片描述
9.因为远程上传文件,需要检查文件是否上传完整,所以需要同时上传md5值
#在自己的服务器中将所有的原始测序文件生成原始md5值
md5sum *fastq.gz >md5check.txt

10.测序数据注释和实验流程概述
为了让大家更好的利用公共数据库中的数据,所以需要大家对自己上传的数据进行充分的注释,geo官方给定的了一个metadata spreadsheet (template and examples),(https://submit.ncbi.nlm.nih.gov/geo/submission/meta/)里面包含了RNA-seq和ChIP-seq数据的模板,可以根据模板填入。填完之后就随数据同时上传即可。
在这里插入图片描述
下图是metadata的示例,根据自己的数据情况,按照模版填写即可。
在这里插入图片描述

11.等所有数据上传完成后,就可以进入最后一步,Notify GEO。

然后填入你上传的文件夹名。如果文章在投或者暂不想公开数据,GEO数据可以将你的测序文件设为私密(最多3年),这个可以自行设置Release date。最后点击Submit,即完成上传的所有流程。

12.最后一步~邮件确认!
待所有数据上传完成并提交之后,会有邮件提醒你的上传是否存在问题,如果无误,就会给定GSE number,表示上传完成。
撒花!!!出GEO编号啦,大概需要一天的样子,我周五晚上还在上传,周六就给GEO编号啦,周一早上打开电脑,一看出来啦,NCBI真给力!!!接下来就是改改论文,准备投稿啦,嘿嘿嘿。
在这里插入图片描述
############小结,就是需要上传的文件有3个。
1.fastq原始数据;2.表达量矩阵;3.metadata样本说明表格。
在这里插入图片描述

向着太阳的喵
关注 关注
  • 12
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
上传RNA-seq数据到NCBI GEO数据库
weixin_34117211的博客
05-29 4700
SRA - NCBI example - NCBI 要发文章了,审稿时编辑肯定会要求你上传NGS测序数据。 一般数据都是放在集群,不可能放在个人电脑上,因为有的数据大的吓人(几个T)。 所以我们就建一个文件夹,然后把所有需要的fastq文件链接到这个文件夹就行了(copy太慢,也太占空间)。 接下来,如何NCBI账号申请好了,那就可以直接上传了,用aspera来上传。 命令如下: ...
高通量测序数据分析:RNA-seq
热门推荐
qq_41134363的博客
06-20 2万+
深度测序相关数据库数据格式 SRA toolkit 一、NCBI 和EBI、DDBJ组成INSDC,数据内容相同所以找NCBI就行。 (一)NCBI常用数据库 GenBank:遗传序列数据库,收集了所有公开的DNA序列及其注释 GEO (Gene Expression Omnibus) :收集整理各种表达芯片数据,后来加入了甲基化、lncRNA、miRNA、CNV等其他芯片,还有高通量测序数据...
测序数据处理 —— 数据上传
最新发布
dxs18459111694的博客
05-14 1033
NCBI的重要性不用说明,你知道的,它很重要。在发表文章时,一般都会要求公开文章中使用的数据。例如,将测序数据上传到NCBI的GEO或者SRA服务器中,然后在文章中使用数据库提供的编号,方便其他人检索和使用。下面,我们简单介绍一下NCBI测序数据上传流程。注意:请确保读完整个文档再开始上传数据,切记!!
NCBI数据上传(一):扩增子测序数据
bioyigene的博客
10-17 2460
本篇文章把上传数据(扩增子测序)的步骤尽可能详细的整理出来,希望能对各位科研工作者有所帮助。其它类型数据上传讲解将依次在后续推文中奉上,大家持续关注哦!
RNA-seq数据上游分析流程(从原始数据开始)
weixin_40640700的博客
03-25 2万+
数据分析的基本思路 (1)从ncbi的geo或者其它数据库中查找自己感兴趣的RNASeq数据,至少要求给出如下信息: 该套数据所发表的文章的名字: 该套数据的下载网址: 该套数据基本情况介绍(简介以及该套数据包含多少个样本,分为多少种类型,以及每种类型有多少个样本) (2)对芯片数据进行质量控制评价及处理(如果质量差的话,每个样本都应该处理), 可以用软件Fastqc+Trimmomatic配合使用,也可以用其它软件替换 (3)用TopHat2 + Cufflinks+Hisat系列软件进.
geo读取表达矩阵 RNA-seq R语言部分(表达矩阵合并及id转换)
生信小博士的博客
06-15 6624
geo读取表达矩阵 RNA-seq R语言 方法一:1.从geo页面直接下载表达矩阵,然后通过r读取表达矩阵 2.利用getgeo函数读取表达矩阵 3.利用geo自带的geo2r,调整p值为1,获取探针和基因名的对应关系1 多个组别 合并 id转化 下载表达矩阵和getgeo函数联合使用 读取excel表达矩阵...
NCBI GEO王炸:GEO2R直接分析RNA-seq数据,几家欢喜几家愁?
微生信
05-06 1323
GEO2R是NCBI GEO团队针对上传GEO的芯片数据开发的一款在线差异分析、可视化作图工具,是广大数据分析人员的福音。然而,一直以来GEO2R仅针对芯片数据,对于越来越多的测序数据,只能下载所上传的matrix矩阵,进行分析,若没有上传表达矩阵,或者基因组版本不合适的话,往往还得下载原始数据重新分析,耗时耗力。
5. 生信技能树——GEO转录组RNA_seq_GSE162550
weixin_48275332的博客
04-13 2725
和生信技能树GEO转录组“GSE150392“分析类似,唯一区别就是在数据处理和ID转换这一环节略微有区别 1.数据下载 最方便的是xena。可以网页下载,也可以用代码下载。 proj = "DHA" 2.生存信息与临床信息 这里仅仅是查看一下,到生存信息部分再整理。 library(GEOquery) eSet = getGEO("GSE162550",destdir = ".",getGPL = F) eSet = eSet[[1]] exp = exprs(eSet) pd = pData(eSet
RNA-seq——快速下载SRA数据、解决fq文件中测序质量全为 ‘?‘ 的问题
Dzfly
08-19 2183
写在前面——在学习RNA-seq时,需要从网上下载公开数据集来上手分析,大部分教程都很古老,其中在ncbi中ftp的下载链接已经不存在了,甚至可以直接下载fastq文件。但是,直接下载的fastq文件做fastqc之后结果为一条直线,因为文件里的测序质量都是30,要想下载带正常质量数据的文件需要换一种方法。
文献RNA-seq复现第1期——文献中mRNA测序数据的获取
qq_53971833的博客
08-25 1817
从文献中获取mRNA测序数据
RNA-Seq数据分析流程
bio_meimei的博客
11-03 1万+
文章目录RNA-seq 数据分析流程相关软件安装下载数据sra转fastq格式数据质控数据质控,过滤低质量reads,去接头比对首先下载参考基因组及注释文件,建立索引比对sam文件转bam为bam文件建立索引reads的比对情况统计计数 counts差异基因分析 RNA-seq 数据分析流程 相关软件安装 可以安装 conda,在后续其他软件安装时非常好用。可自行百度进行安装 可根据文献调研,转录组数据分析所需软件列表: 质控 fastqc , multiqc, trimmomatic, cutadapt
GEO数据上传教程 SuperSeries
m0_46336667的博客
01-05 1217
metadata spreadsheet模板可以在下方下载,一个组学数据填写一个,我有两个组学数据,所以要填写RNA-seq以及WGBS,对应两个xlsx。然后选择RNA-seq文件夹,提交了RNA-seq的metadata数据,提交的时候在comment要求定义为一个super系列,也提供了大标题名,首先选择WGBS文件夹,提交了WGBS的metadata数据,提交的时候在comment要求定义为一个super系列,并提供了大标题名。因为有两个组学数据,我分别建了两个文件夹,WGBS和RNA-seq
最新 NCBI 上传测序数据教程 (图文详解)
Baimoc
04-14 2万+
1、登录或注册用户 网址:https://www.ncbi.nlm.nih.gov/account/ 2、进入SRA 网址:https://submit.ncbi.nlm.nih.gov/ 向下滚动,找到Sequence Read Archive (SRA)工具,点击Submit 2、新建提交 3、按要求填写信息 4、使用ascp ascp -i /mnt/h/work/aspera.openssh -QT -l100m -k1 -d /mnt/h/work/ncbi_upload/raw/ sub
组学数据上传(六)|GEO数据库数据上传实操
bioyigene的博客
10-30 1102
1)注册账号:进入https://www.ncbi.nlm.nih.gov/ 网页,找到页面右上角Sign in ,进入页面后,点击页面中的Sign up,根据自己喜好,选择对应的账号进行注册,按照提示填写账号、密码、邮箱等信息。2)登录账号:输入账号及密码(注册时使用哪种账号注册,登录时选择对应的登录通道登录),点击Log in,然后点击左上角的NCBI大图标回到NCBI的主页,点击图中Submit按钮进入提交数据页面。上传结束后,可点击Notify GEO,提醒GEO后台人员上传完成,可以进行审核。
微生物16S数据上传NCBI的SRA库
Xf_Niu的博客
12-24 4624
本篇内容仅包括:俺自己的实验收集了淡水、淡水沉积物、海水、海草附着微生物样品,测序所得的Fastq格式数据,在文章投稿发表时被要求数据上传NCBI的SRA库,得到一个PRJNA2347899这样子的IDs。仅解决了这个上传过程
RNA-seq分析-数据库
qq_44520665的博客
02-07 5680
!!!!声明:不是原创,我只是方便自己学习,原文指路 NCBI-SRA数据库与EBI-ENA数据库 所有已发表文献中的高通量测序数据大多会上传到某个数据库中方便其他人的下载学习与再研究,这其中受众最广的自然是出身NCBI的SRA数据库。同时出身EBI的ENA数据库对于下载数据有很多便利之处,所以在具体下载文件之前先了解一下这两个数据库的情况。 NCBI与EBI同属于INSDC:International Nucleotide Sequence Database Collaboration,提交给所属三个数
有参转录组实战11-上传转录组到NCBI
liangjinghui123的博客
05-11 763
传转录组的原始数据到NCBI
NCBI数据上传(四):小基因组数据
bioyigene的博客
11-14 2112
数据上传系列已经给大家相继推送了扩增子、转录组、蛋白组学原始数据上传教程,有不少老师在基因组上传过程中也存在着一些疑问,反馈说能否把细菌、病毒、叶绿体和线粒体等小基因组数据上传流程整理发布下,所以这篇小基因组数据上传的推文也就马不停蹄地给大家整理出来啦!话不多说,小基因组数据上传详细步骤给大家奉上!
NCBI|宏基因组原始数据上传
weifanbio的博客
10-19 6395
小编最近学习了关于NCBI数据上传的操作,今天给大家演示宏基因组原始数据上传NCBI的操作,宏基因组原始数据上传NCBI共分为三步,下面小编就为大家一 一讲解吧!希望对大家有所帮助~ 第一步申请Biosample编号 1.首先我们需要进入NCBI网页https://www.ncbi.nlm.nih.gov/,进行注册或登录,操作如下: 如果你有NCBI账号可以直接登录 如果你没有NCBI账号,就可以进行注册操作 你可以选择以下注册平台进行注册 2.注册完成后,就可以进入NCBI页面啦~ 3.点击
rna-seq数据库
07-27
RNA-seq数据库是用于存储和管理RNA测序数据数据库。这些数据库收集和整理了大量的RNA-seq数据,并提供了丰富的功能和工具,以支持研究人员在基因表达分析、转录组注释和功能研究等方面的工作。 一些常见的RNA-seq数据库包括: 1. NCBI Gene Expression Omnibus (GEO):这是一个公共数据库,包含了大量的基因表达数据,包括RNA-seq数据。研究人员可以在GEO中搜索和下载感兴趣的数据集,并进行分析和比较。 2. European Nucleotide Archive (ENA):这是一个欧洲的公共数据库,收集了大量的核酸序列数据,包括RNA-seq数据。研究人员可以在ENA中搜索并访问RNA-seq数据,进行数据挖掘和分析。 3. Sequence Read Archive (SRA):这是一个由NCBI提供的全球性公共数据库,存储了大量的高通量测序数据,包括RNA-seq数据。研究人员可以在SRA中搜索、下载和分析RNA-seq数据。 4. TCGA数据库:这是一个癌症基因组项目的数据库,其中包含了大量的癌症样本的RNA-seq数据。研究人员可以在TCGA中查询和分析癌症相关的RNA-seq数据,以了解肿瘤的基因表达变化。 这些RNA-seq数据库提供了丰富的数据资源和分析工具,帮助研究人员在基因表达研究中获得更深入的理解和洞察。
写文章

热门文章

  • 如何设置MobaXterm内鼠标右键粘贴的快捷键 4667
  • R语言-批量读取数据文件,小白们,赶紧学起来,哈哈哈 3826
  • heatmap绘制热图时出现样本列名顺序调换怎么办? 3449
  • R报错:WARNING: Rtools is required to build R packages but is not currently installed. Please download 1763
  • 如何在GEO数据库上传原始测序数据RNA-SEQ,学习过程分享! 1390

分类专栏

  • 生信 3篇
  • 转录组 3篇
  • R学习 1篇

最新评论

  • Linux下载安装bwa

    陪伴♂: 牛牛牛牛牛表情包

  • Linux让程序在后台运行【常用方法】

    CSDN-Ada助手: 恭喜您发布了第16篇博客!标题为“Linux让程序在后台运行【常用方法】”非常实用,感谢您分享这些常用方法。接下来,建议您可以尝试探讨一些高级技巧或者深入研究某个特定主题,让读者们能够更深入地了解Linux系统。期待您更多的精彩内容,继续加油哦!🌟📝

  • Linux 查看内存还剩多少,文件大小统计

    CSDN-Ada助手: 恭喜您发布了第15篇博客,“Linux 查看内存还剩多少”!您的持续创作精神真是令人钦佩。在这篇博客中,您清晰地介绍了如何在Linux系统中查看内存剩余情况,对读者来说无疑是一次有益的学习。接下来,我建议您可以尝试探讨一些高级的Linux内存管理技巧,或者分享一些实用的系统优化方法,相信会更吸引读者的注意。期待您更多精彩的博客作品!

  • R语言中依据列名删除指定列--打卡第6天

    CSDN-Ada助手: 亲爱的博主,恭喜你已经坚持写了第12篇博客!你的分享真的让我受益匪浅。不过,我想提一个建议,希望你可以在下一篇博客中,结合实际案例,分享一些在R语言中依据列名删除指定列的具体应用场景,这样会更具有实用性和参考价值。期待你的更新,加油!

  • 如何在GEO数据库上传原始测序数据RNA-SEQ,学习过程分享!

    CSDN-Ada助手: 恭喜您写了这么精彩的博客!能够分享如何在GEO数据库上传原始测序数据RNA-SEQ的学习过程,对于想要学习这方面知识的读者来说肯定非常有帮助。希望您能在下一篇博客中继续分享关于RNA-SEQ数据分析的经验和技巧,这样更多的人可以受益于您的经验分享。期待您的下一篇作品!

大家在看

  • 多核心物理隔离USB SERVER和单核心USB SERVER的区别及优势 855

最新文章

  • Linux让程序在后台运行【常用方法】
  • Linux 查看内存还剩多少,文件大小统计
  • 关于样本相关性偏离的判断
2024年6篇
2023年7篇
2022年1篇
2021年2篇

目录

目录

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

天下网标王织金网站关键词优化价格深圳网站优化关键词技巧网站的优化只信j火20星荐河南平台网站快速排名优化贵阳做网站优化渠道网站优化 从写文章开始增城网站优化多少钱融安县网站优化推广兰州网站托管优化哪个公司好临沂关键词网站优化费用项城百度seo网站优化哪里好辽宁教育行业网站优化专业团队医院网站优化策划书初创公司为什么重视网站优化桂阳县网站优化藁城网站优化推广杭州网站推广优化济南家纺行业网站优化推广技巧崇明区网站优化价格盐城建湖网站优化推广seo和网站优化有什么关系家电网站seo优化seo优化门户网站宾县网站seo优化排名网站优化排名易下拉实验济南网站关键词优化哪家好网站做优化保举火13星仁德网站优化首页不要放视频网站优化选择关键词卫浴行业网站优化推广可靠吗香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

天下网标王 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化