感谢大家的支持,欢迎给我留言! 另外,也欢迎合作,包括实验(质粒构建,WB,流式细胞术以及常规毒理学实验等),网站制作,R语言分析绘图,视频制作等,都可。感兴趣可移步至我的简历,底部悬浮按钮可添加微信或邮件联系。
进师兄,晚上好。最近在做前列腺癌的生信分析,下载的TCGA-PRAD数据中死亡的病例非常少(10个左右),所以不能用经典的死亡事件作为终点。查阅文献发现,有人用有无复发(BCR,biochemical recurrence)作为终点,也有用有无复发和进展(DFS,无疾病生存期)作为终点。在参考文献时发现有一篇文献提供非常详细的临床文件,采用的是DFS,所以下载下来后进行学习。然后,我就发现一个问题,不知道作者是如何定义的DFS终点事件,搜索引擎多次查阅都只有相关定义,没有比较详细的区分方法,所以想在这里借这个平台请教下师兄是否了解(实在是找不到答案了),或者有其他小伙伴知道吗?先在此表达感谢! 附上文献https://pubmed.ncbi.nlm.nih.gov/36561322/ 回复
您好,方法和两组一样的:fit <- survfit(Surv(time, status) ~ **(此处分组变量包含多组), data = **),再用ggsurvplot(fit)出的即是多组kmplot 你试试看,搞不定再告诉我 回复
##展示两两之间多重比较结果 surv_pair_diff <- pairwise_survdiff(Surv(OS.time, OS) ~ **, data = data, p.adjust.method = "BH") surv_pair_diff 回复
您好,王老师,又打扰了,想咨询您一下关于K-交叉验证的问题,我投了一篇关于临床诊断预测模型的nomogram,是随机抽取70%作为训练组,30%为验证者的单中心研究,而审稿人问我为什么不用K-Fold Cross-Validation to minimize the selection bias,因为之前在网上搜的方法,然后仿照的文献里也没有用到这个方法,当时没有考虑到这个问题,现在用K折一个是担心时间不够,一个是担心做出来结果有变,有没有好的办法,回复这类问题,期待您的回复,给您添麻烦了。 回复
进哥您好,你的帖子很详细,不过这一篇(https://www.jingege.wang/2020/06/28/%E6%89%8B%E6%8A%8A%E6%89%8B%E6%95%99%E4%BD%A0%E7%94%A8-graphpad-%E7%BB%98%E5%88%B6-roc-%E6%9B%B2%E7%BA%BF/)有几张图加载不出来,不知道是什么原因 回复
您好,想请问一下使用crispr cas9敲除目标位点后进行测序验证,测序PCR扩增的引物和crispr的gRNA有关联吗?设计crispr敲除后的细胞DNA PCR扩增引物时,有什么需要额外考虑的地方吗? 回复
老师您好,学习了你的新版TCGA数据做TMB的文章,受益匪浅。现在有个问题想请教您,在做TMB的时候,如何根据某个指标,将患者分为两组,分别进行TMB呢,比如根据某个基因的表达分成高低两组,进行TMB。打扰您了,期待您的回复。 回复
进师兄,晚上好。最近在做前列腺癌的生信分析,下载的TCGA-PRAD数据中死亡的病例非常少(10个左右),所以不能用经典的死亡事件作为终点。查阅文献发现,有人用有无复发(BCR,biochemical recurrence)作为终点,也有用有无复发和进展(DFS,无疾病生存期)作为终点。在参考文献时发现有一篇文献提供非常详细的临床文件,采用的是DFS,所以下载下来后进行学习。然后,我就发现一个问题,不知道作者是如何定义的DFS终点事件,搜索引擎多次查阅都只有相关定义,没有比较详细的区分方法,所以想在这里借这个平台请教下师兄是否了解(实在是找不到答案了),或者有其他小伙伴知道吗?先在此表达感谢!
附上文献https://pubmed.ncbi.nlm.nih.gov/36561322/
老师,您这边有关于DOE分析的实用资料或者教程吗?
这个没有诶 我第一次听说 回头学习一下
请教师哥,能不能出一个关于构建过表达和敲除质粒的帖子,很想学习一下,但是又不知道如何下手
这个没有整理 因为流程有点多 虽然不难 但是涉及很多分子生物学基本概念,有需要我直接和你讲一下
Hi,我也有同样的困惑,看了很多基本概念和操作流程,但需要自己操作时还是无从下手,大神方便提点一下吗
可以的 你加我微信吧 网站我的简历有手机号和微信
王老师好~多因素重复测量方差分析,能出一期教程吗?spss或者R非常感谢。
我研究土壤生态的。实验处理很多,因素也很多(水、温、碳含量),又监测了4个时间点的土壤N指标。但是现在不会分析了。
哦哦 好的 我抽空整理一下
请教进哥,qpcr的结果,按照您之前教的方法做好了对照组设置靶值,那么在graphpad中计算p值时,是选用哪种计算方法呢?
你好 这个就需要看你需要 两组相比t-test,多组单因素ANOVO
师哥 您好,请问有机会能出一篇多组(三组或四组)生存曲线统计及绘制的教程吗?谢谢
您好,方法和两组一样的:fit <- survfit(Surv(time, status) ~ **(此处分组变量包含多组), data = **),再用ggsurvplot(fit)出的即是多组kmplot 你试试看,搞不定再告诉我
谢谢师哥 我试了下 统计p值好像问题 四个组的统计需要设定特别的参数吗
##展示两两之间多重比较结果
surv_pair_diff <- pairwise_survdiff(Surv(OS.time, OS) ~ **, data = data, p.adjust.method = "BH") surv_pair_diff
已解决 感谢师哥
王老师,您好。想请教一下您,用您上传的代码整合TCGA突变数据后为什么整合后的样本数量变少了
您好,王老师,又打扰了,想咨询您一下关于K-交叉验证的问题,我投了一篇关于临床诊断预测模型的nomogram,是随机抽取70%作为训练组,30%为验证者的单中心研究,而审稿人问我为什么不用K-Fold Cross-Validation to minimize the selection bias,因为之前在网上搜的方法,然后仿照的文献里也没有用到这个方法,当时没有考虑到这个问题,现在用K折一个是担心时间不够,一个是担心做出来结果有变,有没有好的办法,回复这类问题,期待您的回复,给您添麻烦了。
您好,不好意思 这个统计学上的我也不是很清楚,样本量比较少的时候建议使用K-fold,其他我也不清楚了
师哥您好 请问TCGA数据预后模型构建后 一般用GEO做外部验证都会不显著 这应该怎么解决呢
都不显著?不应该吧 循环个上千次 总归会有显著的吧 实在没有只能考虑换验证集 是因为GEO样本量低吗?换一个样本量高一点的
师哥 验证集是按训练集一样的标准(中位数)分组 我好像没在代码有涉及到循环次数… 样本量应该够的 五百多样本 但是感觉异常样本太多了(高风险患者生存时间过长) p值跑出来都0.9了…..
你好,你不是要分割数据集为训练组和测试组吗?这个分割是随机分的 所以也就存在很多种可能 不同可能得到的结果也不一样 一般样本够的话 会有可观结果
师哥您好 我没有分割数据集 整个TCGA的样本都直接用来构建模型了 后面才用GEO数据集作为外部验证 所以发现验证效果并不理想
进哥您好,你的帖子很详细,不过这一篇(https://www.jingege.wang/2020/06/28/%E6%89%8B%E6%8A%8A%E6%89%8B%E6%95%99%E4%BD%A0%E7%94%A8-graphpad-%E7%BB%98%E5%88%B6-roc-%E6%9B%B2%E7%BA%BF/)有几张图加载不出来,不知道是什么原因
已更新 谢谢啦
您好,想请问一下使用crispr cas9敲除目标位点后进行测序验证,测序PCR扩增的引物和crispr的gRNA有关联吗?设计crispr敲除后的细胞DNA PCR扩增引物时,有什么需要额外考虑的地方吗?
关系就是扩增含有gRNA target site和侧翼序列的判断,后续通过测序检测target site是否突变,设计只要考虑能否扩出还有target的序列即可 没有其它特别重要的
老师您好,学习了你的新版TCGA数据做TMB的文章,受益匪浅。现在有个问题想请教您,在做TMB的时候,如何根据某个指标,将患者分为两组,分别进行TMB呢,比如根据某个基因的表达分成高低两组,进行TMB。打扰您了,期待您的回复。
您好,就是将所有样本整合的maf文件根据您的分组进行拆分,分别进行TMB分析,不明白的话直接加微信吧 我的简历有微信
请教进哥,绘制序列的LOGO图能区分大小写字母吗?目前我所尝试的方法输入的序列是有大小写区分的,但是输出的图中都会改成大学字母。
您好,这个我不太清楚,不太明白为什么需要区分大小写。实在需要的话可以修改一下包的函数