张镇海实验室
张镇海
张镇海
广东省人民医院/广东省医学科学院张镇海教授实验室主要研究方向为免疫组库测序技术开发及其在自身免疫疾病、肿瘤、大健康领域的研究及应用。实验室负责人张镇海教授2011年获美国宾州州立大学生物信息学博士学位,曾在美国哥伦比亚大学和NIH疫苗研究中心任博士后研究员近三年。2013年回国后获中组部第五批“青年千人”,同时兼任中国生物工程学会生物信息学委员会副主任委员、广东省生物信息学会副理事长、广东省青年科学家协会常务理事、广东省生物与医药科学专业委员会委员、广东省高性能计算学会理事、中国医师协会检验医师分会循环肿瘤细胞检测检验专家委员会委员。归国以来,主持并参与多项国家级及省市级自然科学基金项目,包括国自然面上项目1项,国自然重点项目1项,其他各类省市级项目3项。张教授团队致力于免疫组库测序实验方法(Immune Repertoine Sequencing,Rep-seq)的开发优化及数据分析系统的开发,已申请专利7项,获得软著2项,并致力于将免疫组库大数据应用于大健康、自身免疫疾病、传染病、癌症、疫苗设计及治疗性抗体开发等领域,在科研和转化上深具潜力。以第一作者/通讯作者在Science、Cell、Cell Reports以及Briefings in Bioinformatics等期刊发表论文40余篇,总影响因子超400,总被引用5700余次数,其中单篇最高引用804次(Google Scholar)。
实验室成员介绍:
张镇海 蓝春红 肖凡书 唐海培 朱 燕 杨修佳 樊 彪 余 巍 陈 森 张家祯
曾惠昆 吴昊宇
实验室学术亮点:
开发了抗体组库测序文库构建方法开发:本实验室自主开发了一套可有效去除样本间及样本内嵌合体序列的抗体组库文库构建方法。抗体组库测序的主要挑战之一是减少在PCR扩增和高通量测序时引入的嵌合体序列。据估计,在扩增相似性序列的时候,由模板转换和PCR介导的序列重组可产生高达30%的嵌合体序列。而这一部分人造序列会对抗体组库特征的观测带来明显偏差。针对这一问题,本实验室开发了一套新的抗体组库测序文库构建方法,即在文库构建过程中,对抗体序列两端同时连接条形码序列以及独特的分子标签序列。在后续数据分析时,利用前者可有效去除样本间的嵌合体序列,而利用后者可有效去除样本内的嵌合体序列。该方法的使用对获得抗体组库的无偏观测具有重要意义。
构建了大型人群抗体组库队列及分析平台:本实验室前期围绕人群尺度下抗体组库特征的基线描绘,收集并完成了上千例健康人及不同类型疾病患者样本的抗体组库测序。同时,结合公共数据库上开放获取的抗体组库数据,构建了大型人群抗体组库研究队列。此外,利用以上数据,本实验室还搭建了一个整合抗体与Rep-seq数据集的免疫组库测序数据分析平台,支持自动化分析Rep-seq数据集,实现免疫组库特征比较与抗体注释。该平台收集了2449套Rep-seq数据集、3.06亿个克隆、521条治疗性抗体和88059条已知功能的抗体,并集成了标准化的Rep-seq数据集分析流程、免疫组库特征比较分析模块、抗体注释模块以及强大的抗体和免疫组库查询功能。
代表性论文:
1. Zhang Z, Pugh BF. High-resolution genome-wide mapping of the primary structure of chromatin. Cell. 2011;144(2):175-86.
2. Zhang Z, Wippo CJ, Wal M, Ward E, Korber P, Pugh BF. A packing mechanism for nucleosome organization reconstituted across a eukaryotic genome. Science. 2011;332(6032):977-80.
3. Sun J, Zhang Y, Wang M, Guan Q, Yang X, Ou JX, et al. The Biological Significance of Multi-copy Regions and Their Impact on Variant Discovery. Genomics Proteomics Bioinformatics. 2020;18(5):516-24.
4. Zhang Y, Yang X, Zhang Y, Zhang Y, Wang M, Ou JX, et al. Tools for fundamental analysis functions of TCR repertoires: a systematic comparison. Briefings in Bioinformatics. 2020;21(5):1706-16.
5. Wang Q, Zeng H, Zhu Y, Wang M, Zhang Y, Yang X, et al. Dual UMIs and Dual Barcodes With Minimal PCR Amplification Removes Artifacts and Acquires Accurate Antibody Repertoire. Frontiers in Immunology. 2021;12:778298.
6. Yang X, Wang M, Wu J, Shi D, Zhang Y, Zeng H, et al. Large-scale analysis of 2,152 Ig-seq datasets reveals key features of B cell biology and the antibody repertoire. Cell Reports. 2021;35(6):109110.
7. Yang X, Zhu Y, Chen S, Zeng H, Guan J, Wang Q, et al. Novel Allele Detection Tool Benchmark and Application With Antibody Repertoire Sequencing Dataset. Frontiers in Immunology. 2021;12:739179.
8. Zhang Y, Chen T, Zeng H, Yang X, Xu Q, Zhang Y, et al. RAPID: A Rep-Seq Dataset Analysis Platform With an Integrated Antibody Database. Frontiers in Immunology. 2021;12:717496.
9. Zhu Y, Yang X, Ma C, Tang H, Wang Q, Guan J, et al. Antibody upstream sequence diversity and its biological implications revealed by repertoire sequencing. Journal of Genetics and Genomics. 2021;48(10):936-45.
10. Chen Y, Ye Z, Zhang Y, Xie W, Chen Q, Lan C, et al. A Deep Learning Model for Accurate Diagnosis of Infection Using Antibody Repertoires. Journal of Immunology. 2022;208(12):2675-85.
实验平台亮点:
1. 大型超算平台:该平台由1台登录,1台管理,2台IO节点,40台CPU计算节点,14台双卡GPU,2台4卡GPU,3台大内存节点,以及1套高性能并行存储(2.3P)搭建组成,核心数超过2600。软件方面,该平台配有大型集群管理软件Xcat(Extreme Cluster Administration Toolkit)、作业调度软件LSF(Load Sharing Facility)、并行开发环境DSS-G等重要集群软件设施。此外,集群常驻工程师还可提供软硬件多方面技术支持。
2. 高通量测序平台:本实验室拥有两台Illumina高端测序仪,一台为Illumina Novaseq 6000,具被超高通量的测序能力,单次运行最高可获取200亿单端读段或400亿双端读段,最大数据产量为6 TB,可满足大样本量的测序要求;一台为Illumina MiSeq,其在单次运行时测序读长高达2x300 bp,除能有效获取抗体可变区全长序列外,其还在微生物多样性分析、宏基因组测序、转录组de novo测序等多个方面具有重要优势。
3. 完备的分子生物实验室:能有力支撑完成包括基因组DNA的分离纯化、质粒DNA的抽提及纯化、RNA的提取、PCR扩增和Southern blot在内的各类分子生物学实验等