STRING网站的官网(网址为https://cn.string-db.org/),左侧一栏是网站的输入方式,右侧一栏是我们的蛋白输入框。通常我们在做PPI时选择输入方式是“Multiple proteins”,即多个蛋白的输入。
1. Input your genelist,并选择对应物种🡪Search
![](https://www.jingege.wang/wp-content/uploads/2023/07/word-image-8776-1.png)
2. Mapping gene symbol
![](https://www.jingege.wang/wp-content/uploads/2023/07/word-image-8776-2.png)
这一步看似平平无奇,实则也很重要,大家看画圈之处应该能看出端倪。
3. PPI network setting
本案例差异基因表较多,所以默认参数下网络过于复杂:
![](https://www.jingege.wang/wp-content/uploads/2023/07/word-image-8776-3.png)
这种情况下我们需要根据实际情况调整参数:
点击setting:
如下图划线部分参数均可调整,已根据要求生成符合自己要求的网络。
我一般主要调整minimum required interaction score为:high confidence或者highest confidence;
此外,勾选hide disconnected nodes in the network,
![](https://www.jingege.wang/wp-content/uploads/2023/07/word-image-8776-4.png)
Update(highest confidence):
![](https://www.jingege.wang/wp-content/uploads/2023/07/word-image-8776-5.png)
4. 其他分析
主要包括富集分析和聚类分析,大家自行尝试:
![](https://www.jingege.wang/wp-content/uploads/2023/07/word-image-8776-6.png)
5. 导出tsv数据
用于导入Cytoscape。
![](https://www.jingege.wang/wp-content/uploads/2023/07/word-image-8776-7.png)
6. 导入Cytoscape
第一步是导入数据:File-Import -Network from file,然后选择TSV格式的文件,默认参数🡪OK。得到一个巨丑无比的网络图,看起来也比较复杂。
![](https://www.jingege.wang/wp-content/uploads/2023/07/word-image-8776-8.png)
7. NetworkAnalyzer美化加工
对于Cytoscape V3.7用户可以很方便进行美化:依次点击Tools- NetworkAnalyzer-Network Analysis-Generate style from statistics。
会出现一个弹窗,如图进行参数调整:
![](https://www.jingege.wang/wp-content/uploads/2023/07/word-image-8776-9.png)
本教程使用的Cytoscape V3.9,可能大多数人使用的高版本,Tools下面只有Network Analysis,没有方便大家的Generate style from statistics。Oh NO!!!!!
没有关系,熟悉的朋友应该会手动进行node和edge参数设置,不多说,详见视频教程。
此外,一向贴心的进哥已经给大家制作了一个Style文件,在Cytoscape中import 🡪 Styles from file 🡪 选择NetworkAnalyzer_styles.xml,将预制style导入软件。
![](https://www.jingege.wang/wp-content/uploads/2023/07/word-image-8776-10.png)
进行Tools🡪Network Analysis后,选择NetworkAnalyzer_styles,瞬间得到和3.7一样的效果:
![](https://www.jingege.wang/wp-content/uploads/2023/07/word-image-8776-11.png)
稍加调整颜色参数,使整体更加清晰:
![](https://www.jingege.wang/wp-content/uploads/2023/07/word-image-8776-12.png)
还算OK,其它还有很多调整,按照自己的审美进行微调。
8. 将LogFC信息加入PPI
可能大家大多数看的文献中都是上图呈现效果,其实只要自己熟悉Cytoscape,完全可以将LogFC,甚至P值信息添加进图中。详见进哥B站视频教程。
9.寻找核心基因+子网络
一般做完差异基因,或者使用其他方法找到想要的biomarker时,想要知道这些基因的调控网络,或者哪些基因在调控网络中处于核心位置,比较常见的方法就是WGCNA或者MCODE、CYTOHUBBA。今天主要介绍MCODE。
按照上述步骤构建好PPI network之后:Apps🡪 MCODE 🡪 open MCODE🡪 Analyze current network:
![](https://www.jingege.wang/wp-content/uploads/2023/07/word-image-8776-13.png)
得到多个Clusters,选中其中一个🡪 Create Sub-Network:
![](https://www.jingege.wang/wp-content/uploads/2023/07/word-image-8776-14.png)
由于使用的NetworkAnalyzer_styles,而新的子网络没有相应参数,所以一片苍白,可以再次进行Tools🡪Network Analysis:
![](https://www.jingege.wang/wp-content/uploads/2023/07/word-image-8776-15.png)
依旧不好看,这个基因便较少,就可以按照自己的喜好自定义子网络,比如换一个style(Ripple):
![](https://www.jingege.wang/wp-content/uploads/2023/07/word-image-8776-16.png)
最后,导出子网络数据:
![](https://www.jingege.wang/wp-content/uploads/2023/07/word-image-8776-17.png)
All right!
Cytoscape是一个功能很强大的网络图绘制工具,还有很多扩展插件,大家感兴趣可以自行摸索,会爱上这个工具。
网盘链接:2016-王进邀请您在Filez协作内容: NetworkAnalyzer_styles.xml 点击链接查看: https://console.box.lenovo.com/l/nuNTPt提取码: zclt到期日: 2024-07-18
最后祝大家科研实验顺利!
您好,我也是做CRISPR/CAS9敲除的,最近是在做海水模式生物青鳉鱼生殖基因的敲除,F0代明明有测序验证存在非3倍的碱基缺失,但敲除后得到的F1代全都是3倍的碱基缺失,我始终想不明白,于是就用SMART预测了一下蛋白的功能域,然后重新设计了新的2个靶点(这两个靶点分别位于功能域的首尾),F0代测序验证后,全都是3倍的碱基缺失,唯一一个非3倍的碱基缺失,还是因为脱靶(无法使用),现在我想破脑袋也不明白,请问您可以帮我分析一下为什么会出现这种状况吗?感谢!
您好,根据您的描述,我也想不明白,实在不行还是建议双敲吧,把整段基因或者启动子敲掉
进哥 第二步Mapping gene symbol是什么意思呢,可以展开说说吗
就是:很多基因都有别名,而且不止一种别名,所以这一步mapping就是把你input的genelist与String数据库里面的genesymbol进行映射