STRING网站+Cytoscape软件制作精美蛋白互作网络图(PPI)

STRING网站的官网（网址为https://cn.string-db.org/），左侧一栏是网站的输入方式，右侧一栏是我们的蛋白输入框。通常我们在做PPI时选择输入方式是“Multiple proteins”，即多个蛋白的输入。

1. Input your genelist，并选择对应物种🡪Search

2. Mapping gene symbol

这一步看似平平无奇，实则也很重要，大家看画圈之处应该能看出端倪。

3. PPI network setting

本案例差异基因表较多，所以默认参数下网络过于复杂：

这种情况下我们需要根据实际情况调整参数：

点击setting：

如下图划线部分参数均可调整，已根据要求生成符合自己要求的网络。

我一般主要调整minimum required interaction score为：high confidence或者highest confidence；

此外，勾选hide disconnected nodes in the network，

Update（highest confidence）：

4. 其他分析

主要包括富集分析和聚类分析，大家自行尝试：

5. 导出tsv数据

用于导入Cytoscape。

6. 导入Cytoscape

第一步是导入数据：File-Import -Network from file,然后选择TSV格式的文件，默认参数🡪OK。得到一个巨丑无比的网络图，看起来也比较复杂。

7. NetworkAnalyzer美化加工

对于Cytoscape V3.7用户可以很方便进行美化：依次点击Tools- NetworkAnalyzer-Network Analysis-Generate style from statistics。

会出现一个弹窗，如图进行参数调整：

本教程使用的Cytoscape V3.9，可能大多数人使用的高版本，Tools下面只有Network Analysis，没有方便大家的Generate style from statistics。Oh NO！！！！！

没有关系，熟悉的朋友应该会手动进行node和edge参数设置，不多说，详见视频教程。

此外，一向贴心的进哥已经给大家制作了一个Style文件，在Cytoscape中import 🡪 Styles from file 🡪 选择NetworkAnalyzer_styles.xml，将预制style导入软件。

进行Tools🡪Network Analysis后，选择NetworkAnalyzer_styles，瞬间得到和3.7一样的效果：

稍加调整颜色参数，使整体更加清晰：

还算OK，其它还有很多调整，按照自己的审美进行微调。

8. 将LogFC信息加入PPI

可能大家大多数看的文献中都是上图呈现效果，其实只要自己熟悉Cytoscape，完全可以将LogFC，甚至P值信息添加进图中。详见进哥B站视频教程。

9.寻找核心基因+子网络

一般做完差异基因，或者使用其他方法找到想要的biomarker时，想要知道这些基因的调控网络，或者哪些基因在调控网络中处于核心位置，比较常见的方法就是WGCNA或者MCODE、CYTOHUBBA。今天主要介绍MCODE。

按照上述步骤构建好PPI network之后：Apps🡪 MCODE 🡪 open MCODE🡪 Analyze current network：

得到多个Clusters，选中其中一个🡪 Create Sub-Network:

由于使用的NetworkAnalyzer_styles，而新的子网络没有相应参数，所以一片苍白，可以再次进行Tools🡪Network Analysis：

依旧不好看，这个基因便较少，就可以按照自己的喜好自定义子网络，比如换一个style（Ripple）：

最后，导出子网络数据：

All right！

Cytoscape是一个功能很强大的网络图绘制工具，还有很多扩展插件，大家感兴趣可以自行摸索，会爱上这个工具。

网盘链接：2016-王进邀请您在Filez协作内容: NetworkAnalyzer_styles.xml 点击链接查看: https://console.box.lenovo.com/l/nuNTPt提取码: zclt到期日: 2024-07-18

最后祝大家科研实验顺利！

打赏赞(15)

4 Replies to “STRING网站+Cytoscape软件制作精美蛋白互作网络图(PPI)”

您好，我也是做CRISPR/CAS9敲除的，最近是在做海水模式生物青鳉鱼生殖基因的敲除，F0代明明有测序验证存在非3倍的碱基缺失，但敲除后得到的F1代全都是3倍的碱基缺失，我始终想不明白，于是就用SMART预测了一下蛋白的功能域，然后重新设计了新的2个靶点（这两个靶点分别位于功能域的首尾），F0代测序验证后，全都是3倍的碱基缺失，唯一一个非3倍的碱基缺失，还是因为脱靶（无法使用），现在我想破脑袋也不明白，请问您可以帮我分析一下为什么会出现这种状况吗？感谢！

进哥哥说道：

2023-07-28 12:12

您好，根据您的描述，我也想不明白，实在不行还是建议双敲吧，把整段基因或者启动子敲掉

回复

进哥第二步Mapping gene symbol是什么意思呢，可以展开说说吗

进哥哥说道：

2023-07-21 12:34

就是：很多基因都有别名，而且不止一种别名，所以这一步mapping就是把你input的genelist与String数据库里面的genesymbol进行映射

回复