感谢大家的支持,欢迎给我留言!


另外,也欢迎合作,包括实验(质粒构建,WB,流式细胞术以及常规毒理学实验等),网站制作,R语言分析绘图,视频制作等,都可。感兴趣可移步至我的简历,底部悬浮按钮可添加微信或邮件联系。


406 Replies to “给我留言”

  1. 您好,请教一个问题:CCLE数据库中的药敏数据,每个细胞系有一个名称(CCLE Cell Line Name)。RNA-seq数据中每个样本也有一个名称。但是这两个名称不是一一对应的。
    我想用这两组数据做药物基因学分析,请问怎么能把这两组数据的名称对应上?

    1. 您好 这个我没有研究过,不过按照经验应该有一个map的文件,你找到了吗?还没有的话我看看

  2. 如果x指标的测量值是连续的,结局指标y也是连续性变量,如何将x指标进行分类(分为两组),才能够获得y指标在两组间差异最大,最大选择检验是否可行?R语言里,maxstat包能否实现?感谢

    1. 你好,据我所知maxstat适用于连续变量生存分析的分组,不知道你这两组是要有什么检验方法?maxstat这个只能选择“Wilcoxon”, “Median”, “NormalQuantil”, “LogRank”, “Data”其中的一个
      实在不行写个循环来判断最佳截断点

  3. 老师,您好!想请教一个关于PAM位点的问题,为什么有的显示PAM位点在左面(GGN),有时候又会写在右面呢(NGG)?

  4. 师兄好!
    我是苏大生物学的一名在读博士生,去年开始自学生信分析,目前涉及较多的是R语言,也涉及到少量python和shell的使用,但是基础不扎实,分析的过程会遇到各种问题,抄别人的代码比较多,面对导师分配的一些问题,通过现有的基础,不会灵活分析和画图,想请教一下师兄,可以通过哪些书籍资料或者视频资料夯实基础。感谢师兄!!!ps: 师兄是我的新大神!

    1. 你好,其实我也不太清楚有哪些书籍资料,都是要用的时候上网找,基本都会有 或者查看包的说明文档,很多东西涉及个性化设置
      PS:大神不敢,需要的话来我办公室讨论,402-2419,目前毕业留校博士后了

  5. 老师您好,请问您可以出一份详细的教程指导怎么在letpub上爬取国家自然基金的信息吗

  6. 进哥你好,萌新想请教下免疫组化定量 在文章里一般用什么表示呢,是用光密度吗?还是阳性面积可以吗?还有我的图片测出来光密度模型组和空白组差不多,但是光看图片模型组是成功的,请教您。

  7. 您好,我看到您之前的文件中有提到TCGA中样本编号中01B表示福尔马林标本测序数据,但在官网的说明中没有看到相关说明,能烦请您指教一下这个解释在哪里有源文档说明吗?

  8. 进哥能不能详细将以下,同源重组法基因敲除,第一次交换,二次交换引物如何设计啊?真的非常需要!!!希望进哥能看到

  9. 您好,虽然特别不好意思,想请问您有没有mega7,GraphpadPrism,Primer 和Endnote的MacOS版本安装包,我是一名生物工程专业大三学生,要上生物信息学课程了,却找不到Mac的安装包,偶然翻到了您的网站,成功下载了snapgene,非常感谢!

    1. 只有graphpad和endnote
      链接:https://pan.baidu.com/s/1IC-9o6dbFSpp0zTU3oKZHg?pwd=6yv4
      提取码:6yv4
      链接:https://pan.baidu.com/s/15YZH-fEIFc8e8G0ahJjZrg?pwd=anhx
      提取码:anhx

  10. 您好,如何用Perl脚本提将肿瘤突变文件MAF结合风险分组文件将总MAF分成高低风险组MAF文件,谢谢!

  11. 您好,基因突变信息的MAF文件怎么分组?已经有了分组的文件,谢谢。

    1. 您好,其实就是按照MAF文件中的样本编号进行拆分,R语言读取maf和分组文件,用plotly包的filter函数可以很快实现

  12. 博主您好,请问您可以出一篇关于蛋白质乳酸化的相关知识吗?按理说,组蛋白乳酸化之后会影响相关DNA的表达,如果我不测序的话,该怎样找到这个基因呢?可以通过chip-pcr吗?

    1. 你好 这个不是很清楚,按照经验应该是要进行ChIP-seq或CUT&Tag进行筛选
      如果不想做的话只能从别人做的文章中去查他们的原始数据有没有公开 进行分析

  13. 很神奇的发现了这个宝藏网站,被大神的细腻惊呆了。我了解到您对免疫以及流式有很多深入的研究,可否跟您详细咨询一些问题?

  14. 您好,TCCA和GTEx两个数据库,肿瘤和正常mRNA差异分析需要去除批次效应吗?去除批次效应后差异分析没有差异基因是怎么回事?谢谢!

    1. 您好 这个问题比较麻烦,因为两个数据集一个是肿瘤一个是正常组织,就算不存在批次效应,二者也会有区别;这样的话你去除批效应就把肿瘤和正常组织的区别给处理掉了

      1. 您好,我分析的这个肿瘤,TCGA和GTEx数据,去除批次效应前的箱线图显示肿瘤明显低于正常组织,这样差异分析出来会有很多下调基因。去除批次效应后,肿瘤和正常组织就没有差异基因了。这个是怎么回事?您有遇到过类似的问题吗?
        limma包的removeBatchEffect 函数会在去除批次效应的同时把肿瘤和正常组织之间的差异也去除掉吗?

  15. 王进老师,您好,感谢您分享的“蛋白质磷酸化及其检测方法简介”,有个问题想请教下您,就是除了您分享的检测底物蛋白磷酸化的实验外,是否可以用phos-tag实验检测呢?我想证明一个磷酸酶是否可以使其底物蛋白发生磷酸化,经典的实验是用32P同位素示踪法,但是我们实验没有同位素检测的仪器,所以想请教下您,是否可以用phos-tag实验,这个检测方法是否是被认可的?

    1. 您好,这个当然可以 现在同位素的用的很少了,大多更愿意采用安全方便的标记方法,phos-tag当然可以,查文献也会发现应用很多

  16. 王老师您好!学习生信偶然发现了这个宝藏网站,给我的生信之路提供了很大帮助。请问老师后面可以考虑出一期关于circRNA引物设计的教程吗?十分感谢!

  17. 师兄好,查找资料偶然发现了宝藏网站,感谢您的分享。
    有一个问题想请教,基因编辑cas9蛋白剪切DNA形成双链断裂,非同源末端连接造成碱基的缺失或者插入,形成插入或缺失的过程是因为Artemis同时具有DNA内切酶和外切酶活性,cas9蛋白的剪切破坏了5-磷酸和3-OH,Artemis会把有问题的碱基切掉或者插入碱基,我这样理解对吗?cas9蛋白的剪切仅仅是破坏了磷酸二酯键吗?有没有其他损伤?为什么修复的时候会插入或者缺失碱基?Artemis是没有原则规律的随便插入和缺失的吗?
    打扰您了,期待您的回复。

    1. 您好,这个问题比较细节,我也没有很多了解,就我了解而言,cas9破坏了磷酸二酯键,导致末端基团的破坏,启动nhej
      破坏磷酸二酯键可能产生多样的末端,除了仅破坏磷酸二酯键产生的平末端,也可能产生其它粘性末端,也就是说可能除了破坏磷酸二酯键,还掉了几个碱基,后续修复之前会先对粘性末端进行修复补齐,再进行nhej
      因为连接需要完整的末端基团,首先会对破坏的碱基进行切割,然后连接,这就是缺失的原因,当然,如果存在游离DNA片段或者碱基或者更短的寡聚核苷酸,也可能在连接的时候被插进去,这就是增加的原因
      更多的我也不甚清楚,涉及比较细节的分子生物学原理,我也相信有些原理目前还未明确

  18. 您好,我想询问一下,同源重组进行基因敲除的操作中在获得目的基因上下游的同源臂连接产物后将其构建重组质粒,再将质粒线性化导入受体菌后使其同源重组,这个过程中基因的方向不会发生改变吗?

  19. 本来是做实验设计作业,找各种酶切位点的保护碱基,结果发现这么一个宝藏网站,哈哈哈哈哈哈哈哈。还有就是想请教一下,引物设计的时候不是每个原则都能满足的,那么要优先满足哪些条件呢?比如说引物的长度啊,Tm值啊,GC含量啊,构建载体的时候酶切位点保护碱基的添加啊等等。

    1. 一般情况下我主要考虑的是Tm,还有引物二聚体这些,一般我设计好之后会在NCBI blast上比对一下,会给出这些数据,最主要还是看目前的互补序列会不会造成非特异性扩增,如果有 适当增加互补区域长度。
      保护碱基按照酶切效率选择添加,当然最好都添加,对于真核基因 建议起始密码子前添加kozak序列增强翻译

  20. 师兄你好:
    学习了你的新版TCGA数据做TMB的文章,太详细了。浏览网站后有被惊艳到,发现还是同校亲师兄。太爱了!向师兄学习!

  21. 王博你好!
    谢谢您创建的分享网站造福大家hh。因为最近想做miRNA的生信分析,在查找“使用cytoscape构建miRNA-mRNA网络”时发现了您这个网站,您的这篇分享对我这种生信小白非常实用,不过其中的一个链接”下载miRNA数据库:http://projects.bigcat.unimaas.nl/cytargetlinker/regins/“,已无法打开,能否有空更新一下?另外,不知道方不方便加您一个微信,有些生信问题想要请教。非常感谢!

  22. 进哥哥优秀!从这学到了很多关于单基因的分析,非常nice,最近对基因的外显子感兴趣但是苦与网上没有合适的教程,不知道优秀的进哥哥有没有时间做一期呢?https://tcga-xena-hub.s3.us-east-1.amazonaws.com/download/TCGA.PANCAN.sampleMap%2FHiSeqV2_exon.gz贴数据链接,许愿进哥哥可以看见~

      1. 进哥哥是不是忘了这一条【😭】,还在盼望着进哥哥的教程

          1. 做外显子表达分析,可视化出某个或某几个外显子异常表达,类似DEXseq的可视化

  23. 您好,我做RNA降解实验,一直结果不好,我想请教,实验过程中用不用内参?逆转录是等体积转录还是1000ng转?如果您有完成的protocol可不可以给我一份,以做参考!非常感谢您的帮助!

  24. 博主您好:

    非常感谢您创建的分享网站。因为现在想做基因表达量预测模型研究,需要大量的真实数据验证模型,我自己也找了一部分网站,尤其是人类的,但是基因组数据都不共享。请问哪里能够下载相互匹配的基因组和基因表达量数据?
    期待您的回复!

    1. 您好 这个我也不清楚诶 对于某些特定疾病可能有专门的数据库 其他的话我一般在GEO和arrayexpress查找

  25. 王博优秀,最近正好遇到一些组化批量统计的问题,就查到了你。网站里面你的其他工作同样出色优秀!!!

  26. 哇哦!之前搜实验方法老是会点进来,今天认真的看了一下,才发现这是个人网站。好棒呀!居然还有记录爱情的板块!师兄今年是不是要博士毕业了呀,我看了一下学术成果,真是望尘莫及!师兄优秀!人生赢家!在这里学习了很多知识,感恩,祝好!

  27. 天啊,我就是来学习一下软件,还被塞了一把狗粮,太浪漫了!!

  28. 王老师你好,在用flowjo分析PBMC流式数据的时候,由于是来自几个患者的不同样本,不知是哪里有问题,导致目的细胞在图上的位置有明显偏移,以至于几个样本间不能直接复制同一个圈门策略,那最后它们之间还可以做比较分析吗?是直接应用同一圈门策略,还是按照各自的圈门结果比较呢?

    1. 您好,请问是指的哪个圈门中偏移?如果是SSC/FSC,一般不会有太大偏移,如果有检查一下电压值,确定无误的话 按照实际样本的圈门进行分析 不能统一圈门
      如果是涉及荧光的圈门,可能染色时间的差异或者其他操作引起,这样的话如果涉及细胞百分比,可以适当动一下圈门,如果是考察平均荧光强度 是不能随意变动的

      1. 就是从fsc/ssc开始就和其他不一样,所以后面的圈门都要挪一挪,重复实验也一样,考虑个体细胞大小差异吗。意思是最后比较MFI的时候必须保持所有圈门一致,那是从fsc/ssc的时候就保持一致,还是说只用在最后荧光通道的时候保持一致就行呢?谢谢回复

        1. FSC/SSC到也没必要,可能细胞大小差异较大 计算MFI当然要在一个当前这个圈门一致的情况下 前面的没有关系

  29. 我搜同源重组定向修复以外发现这个网站,有意思,感受到了对科研的热情,还看了看记录爱情的栏目,真好。想问问作者身边有单身帅小伙吗,可以给我介绍一下吗。

  30. 师兄您好,我再使用Genorm的时候,运行到selectHKs函数的时候持续报错:Error in (function (classes, fdef, mtable) :
    函数‘selectHKs’标签‘”ExpressionSet”’找不到继承方法。分析最初的目的是为了从三万个基因中找到一个稳定的内参基因,但持续报错,怀疑是基因太多了,就筛选出来十个基因,数量与example中的数量一致,但仍然报错。确认加载了NormqPCR包。前面的分析都是学习您的笔记,想请教您,问题出在哪里?

  31. 不知老师能不能出一期pymol的使用教程以及蛋白进化相关实验的指导?感谢

    1. pymol可以搜刘永鑫老师的博客,有看到过分子对接的详细教程

  32. 进师兄,晚上好。最近在做前列腺癌的生信分析,下载的TCGA-PRAD数据中死亡的病例非常少(10个左右),所以不能用经典的死亡事件作为终点。查阅文献发现,有人用有无复发(BCR,biochemical recurrence)作为终点,也有用有无复发和进展(DFS,无疾病生存期)作为终点。在参考文献时发现有一篇文献提供非常详细的临床文件,采用的是DFS,所以下载下来后进行学习。然后,我就发现一个问题,不知道作者是如何定义的DFS终点事件,搜索引擎多次查阅都只有相关定义,没有比较详细的区分方法,所以想在这里借这个平台请教下师兄是否了解(实在是找不到答案了),或者有其他小伙伴知道吗?先在此表达感谢!
    附上文献https://pubmed.ncbi.nlm.nih.gov/36561322/

    1. 你好,这里面有简单介绍,http://www.cell.com/cell/fulltext/S0092-8674(18)30229-0 这篇文章有介绍和数据来源
      生存数据可以从:https://xenabrowser.net/datapages/?dataset=survival%2FPAAD_survival.txt&host=https%3A%2F%2Ftcga.xenahubs.net&removeHub=https%3A%2F%2Fxena.treehouse.gi.ucsc.edu%3A443下载
      还有问题可以加微信

      1. 感谢师兄,因为是自己琢磨,对于这类高分的说明性的文献看的很少,感谢!学习到很多

  33. 搜索Fiji分析时搜到了你的网站,虽然我不是生物医药相关行业的,但你的文章还是对我挺有帮助的。看了下你的整个网站,很有意思,祝新的一年万事顺利。

  34. 请教师哥,能不能出一个关于构建过表达和敲除质粒的帖子,很想学习一下,但是又不知道如何下手

    1. 这个没有整理 因为流程有点多 虽然不难 但是涉及很多分子生物学基本概念,有需要我直接和你讲一下

      1. Hi,我也有同样的困惑,看了很多基本概念和操作流程,但需要自己操作时还是无从下手,大神方便提点一下吗

  35. 王老师好~多因素重复测量方差分析,能出一期教程吗?spss或者R非常感谢。
    我研究土壤生态的。实验处理很多,因素也很多(水、温、碳含量),又监测了4个时间点的土壤N指标。但是现在不会分析了。

  36. 请教进哥,qpcr的结果,按照您之前教的方法做好了对照组设置靶值,那么在graphpad中计算p值时,是选用哪种计算方法呢?

  37. 师哥 您好,请问有机会能出一篇多组(三组或四组)生存曲线统计及绘制的教程吗?谢谢

    1. 您好,方法和两组一样的:fit <- survfit(Surv(time, status) ~ **(此处分组变量包含多组), data = **),再用ggsurvplot(fit)出的即是多组kmplot 你试试看,搞不定再告诉我

      1. 谢谢师哥 我试了下 统计p值好像问题 四个组的统计需要设定特别的参数吗

        1. ##展示两两之间多重比较结果
          surv_pair_diff <- pairwise_survdiff(Surv(OS.time, OS) ~ **, data = data, p.adjust.method = "BH") surv_pair_diff

  38. 王老师,您好。想请教一下您,用您上传的代码整合TCGA突变数据后为什么整合后的样本数量变少了

  39. 您好,王老师,又打扰了,想咨询您一下关于K-交叉验证的问题,我投了一篇关于临床诊断预测模型的nomogram,是随机抽取70%作为训练组,30%为验证者的单中心研究,而审稿人问我为什么不用K-Fold Cross-Validation to minimize the selection bias,因为之前在网上搜的方法,然后仿照的文献里也没有用到这个方法,当时没有考虑到这个问题,现在用K折一个是担心时间不够,一个是担心做出来结果有变,有没有好的办法,回复这类问题,期待您的回复,给您添麻烦了。

    1. 您好,不好意思 这个统计学上的我也不是很清楚,样本量比较少的时候建议使用K-fold,其他我也不清楚了

  40. 师哥您好 请问TCGA数据预后模型构建后 一般用GEO做外部验证都会不显著 这应该怎么解决呢

    1. 都不显著?不应该吧 循环个上千次 总归会有显著的吧 实在没有只能考虑换验证集 是因为GEO样本量低吗?换一个样本量高一点的

      1. 师哥 验证集是按训练集一样的标准(中位数)分组 我好像没在代码有涉及到循环次数… 样本量应该够的 五百多样本 但是感觉异常样本太多了(高风险患者生存时间过长) p值跑出来都0.9了…..

        1. 你好,你不是要分割数据集为训练组和测试组吗?这个分割是随机分的 所以也就存在很多种可能 不同可能得到的结果也不一样 一般样本够的话 会有可观结果

          1. 师哥您好 我没有分割数据集 整个TCGA的样本都直接用来构建模型了 后面才用GEO数据集作为外部验证 所以发现验证效果并不理想

  41. 进哥您好,你的帖子很详细,不过这一篇(https://www.jingege.wang/2020/06/28/%E6%89%8B%E6%8A%8A%E6%89%8B%E6%95%99%E4%BD%A0%E7%94%A8-graphpad-%E7%BB%98%E5%88%B6-roc-%E6%9B%B2%E7%BA%BF/)有几张图加载不出来,不知道是什么原因

  42. 您好,想请问一下使用crispr cas9敲除目标位点后进行测序验证,测序PCR扩增的引物和crispr的gRNA有关联吗?设计crispr敲除后的细胞DNA PCR扩增引物时,有什么需要额外考虑的地方吗?

    1. 关系就是扩增含有gRNA target site和侧翼序列的判断,后续通过测序检测target site是否突变,设计只要考虑能否扩出还有target的序列即可 没有其它特别重要的

  43. 老师您好,学习了你的新版TCGA数据做TMB的文章,受益匪浅。现在有个问题想请教您,在做TMB的时候,如何根据某个指标,将患者分为两组,分别进行TMB呢,比如根据某个基因的表达分成高低两组,进行TMB。打扰您了,期待您的回复。

    1. 您好,就是将所有样本整合的maf文件根据您的分组进行拆分,分别进行TMB分析,不明白的话直接加微信吧 我的简历有微信

  44. 请教进哥,绘制序列的LOGO图能区分大小写字母吗?目前我所尝试的方法输入的序列是有大小写区分的,但是输出的图中都会改成大学字母。

    1. 您好,这个我不太清楚,不太明白为什么需要区分大小写。实在需要的话可以修改一下包的函数

发表评论

邮箱地址不会被公开。 必填项已用*标注