背景简介:
2019年度国家自然基金医学科学部共批资助10138项目,批助金额总计441310万元。其中面上项目数量占45%,金额占57%;青年科学基金项目数量占43%,金额占20%。
初步统计,这些项目中大部分都与编码基因有直接或间接的关联。其中,与通路(pathway)关联的有1349项,金额4.89亿;与miRNA相关的有630项,金额2.3亿;与lncRNA相关的有395项,金额1.45亿;
如何获得有创新意义的疾病靶标基因(mRNA,Protein,lncRNA,circRNA,miRNA,Mutation等)是项目申请及文章写作时最常见的问题。基于这个目的,我们开展了该培训班:TCGA&GEO高通量数据挖掘。癌症是临床医学中非常重要的疾病方向。TCGA数据库中包含了常见了40种癌症方向(含30000个样本)的高通量数据及临床信息。大家对TCGA数据库的使用近几年也在逐渐增加!另外,其他疾病的研究可以通过GEO数据库进行。
项目类型 | 题目 | 金额/万元 |
重点项目 | FXYD3介导的信号网络对肠道黏膜免疫稳态的调控研究 | 300 |
重点项目 | 基于蛋白-蛋白相互作用精准调节转录因子Nrf2活性及探索其作为肝细胞癌治疗的新靶标 | 298 |
重点项目 | miR-23b/24-1簇防治烧伤后脓毒症所致MODS的系统研究 | 297 |
面上项目 | LZTR1基因突变导致的RAS/MAPK通路过度激活以及Noonan综合征相关肥厚型心肌病的机制研究 | 60 |
面上项目 | SUGP2基因及其突变在遗传性血色病中的致病作用及其机制研究 | 60 |
面上项目 | WDR73基因突变在Galloway-Mowat综合征中的致病机制研究 | 60 |
面上项目 | STAG2通过ERK/AKT/GSK3β/c-Myc反馈通路调节甲状腺癌谷氨酰胺代谢的机制研究 | 60 |
面上项目 | LncRNA FOXF1靶向调控动力相关蛋白1表达在缺氧诱发肺动脉内皮细胞焦亡中的作用及分子机制 | 55 |
会议预期:
通过三天的学习,我们了解生信分析思路对项目及文章的帮助,以及实操常见的数据库、在线工具和本地软件。使得学员可以自己完成一个完整的分析报告并获得疾病相关的靶标基因。
讲师简介:宋伟博士
成果:参与完成了近百篇软件著作权和发明专利的撰写和申请;肺癌、胰腺癌、骨肉瘤、胃癌等数据库的分析和构建;完成个体基因检测流程和无创唐筛流程的开发。
研究方向:有近十年的生信分析经验,擅长方向有转录组测序分析、芯片数据分析、疾病机理研究分析、疾病预后与基因关联分析、项目分析思路设计以及个性化分析等,精通perl、R等编程语言。
培训经历:在上海、北京、广州、沈阳、南京等城市举办过几十场培训班。
主办方:上海科贛信息科技中心
会议地点:线上:腾讯网络会议室,
会务费用:3200元/人;
优惠政策:
1.提前确认报名及转账的,可以提前拿到学习材料
2.三人组团报名,每人优惠100元
3.四人组团报名,每人优惠200元,
4.六人组团报名缴费,可免1人参会费!
可以开正规会务发票,纸质邀请函(盖红章)。
注意事项:必须使用win7以上系统的电脑,现场不得录音录像。上课软件为Cytoscape,Heml,GSEA,R和Rstudio。
另外需安装腾讯会议软件。
报名方式:
唐老师:172 6943 7589(微信同号)邮箱:17269437589@163.com
报名链接:http://www.shkegan.cn/form.aspx?ClassID=18
请务必详细填写报名表,并收到回复方可确认完成报名。提前付款的老师,请将截图一起发回并留存备份。
详细日程参见日程表
TCGA&GEO高通量数据挖掘分析实操强化研讨会 |
时间安排 | 课程表 | 介绍 |
第一天 | 9:00~10:30 | 生信简介 | 生物信息介绍 |
高通量:测序及芯片介绍——不同组学:转录组学、基因组学、表观组学、顺反组学、宏基因组学等。 |
经典生信SCI文章的解读,了解TCGA数据库、GEO 数据库这些公共数据的挖掘获得创新结论并发文章的思路。 |
10:45-12:00 | TCGA数据库 NCBI GEO数据库 | TCGA数据库:最全的癌症高通量数据公共库(简介) |
TCGA数据库的介绍和使用(包含了转录组、基因组、表观组和临床信息数据) |
GEO数据库介绍: 数据量最大的高通量公共数据库。 |
GEO数据库的高通量芯片数据查找、筛选、探针转换、差异分析等。 |
12:00-13:30 | 午餐及午休 |
13:30~15:00 | R语言学习 | R软件与Rstudio软件下载、安装、界面。 R语言基础:元素、向量、矩阵、数组 R语言函数:计算函数、统计函数等 R语言路径确认及修改 R语言文件(图、表)的导入和导出 |
15:20~17:00 | R语言学习 | R语言包:包的下载安装 R语言:差异分析limma包使用、火山图制作 |
第二天 | 8:30~10:00 | TCGA相关的下载工具 | TCGA数据库癌症数据下载:RNA-seq数据、miRNA-seq数据、甲基化数据、基因组数据及临床信息数据的下载 TCGA数据书库癌症数据的处理,获得关键mRNA、miRNA的表达谱矩阵。 |
10:20~12:00 | TCGA相关的分析工具 | TCGA数据分析——突变分析、差异分析、关联分析、生存分析、miRNA调控靶基因分析等。 Cbioportal数据库学习 R语言做生存曲线KM图(批量) |
12:00-13:30 | 午餐及午休 |
13:30~17:00 | 数据的后续高级分析工具实战 | DAVID功能富集分析——GO富集和KEGG pathway富集分析 |
通路map图构建 |
聚类热图制作 R语言pheatmap包做聚类热图 |
蛋白与蛋白互作分析(PPI)——STRING数据库 |
第三天 | 8:30~12:00 | 数据的后续高级分析工具实战 | cytoscape软件(上):网络图构建与美化 |
cytoscape软件(下):插件使用 |
GSEA软件的实操:全基因集富集分析 |
12:00-13:30 | 午餐及午休 |
13:30~16:00 | 思路讨论 | 基于GEO数据库多套数据整合(meta)分析思路演练 |
基于TCGA的lncRNA-miRNA-mRNA全转录组整合分析思路演练 |
基于TCGA的甲基化与转录组整合分析思路演练 |
基于TCGA的基因组与转录组整合分析思路演练 |
串讲 | 思路大串讲 |
备注:讲师使用windows10系统讲解,建议携带同样系统的电脑 |
上课软件为:Cytoscape,Heml,GSEA,R和Rstudio |
通过本次学习,您可以学会以下作图(包括但不限于)