A:用的cdocker將晶體復(fù)合物的配體對(duì)接回原來(lái)的蛋白質(zhì)重合度不好啊,rmsd也比較高,請(qǐng)問(wèn)大家對(duì)接時(shí)受體蛋白加力場(chǎng)嗎?
B:參數(shù)沒(méi)設(shè)置好吧。
C:要分析原因哦。
(1)是所有對(duì)接計(jì)算出來(lái)的pose都不好?
(2) 還是打分最好的那個(gè)不好,打分差的反而好?
(3)還是根本沒(méi)有生成活性構(gòu)象。
如果生成了活性構(gòu)象,而打分函數(shù)沒(méi)有把他挑出來(lái),說(shuō)明打分函數(shù)有問(wèn)題,需要換一個(gè)打分函數(shù)。如果根本沒(méi)有擺出正確pose,需要改變搜索策略。或者干脆換軟件。
活性預(yù)測(cè)D:我現(xiàn)在自己做小分子活性預(yù)測(cè)的深度學(xué)習(xí),在建模的過(guò)程中有個(gè)問(wèn)題,訓(xùn)練集多少比較合適?
C:深度學(xué)習(xí)以不過(guò)擬合為準(zhǔn),同一個(gè)靶標(biāo)的QSAR估計(jì)你要幾千個(gè)數(shù)據(jù)點(diǎn),我做過(guò)的都有6000,7000,8000或更多以上。
D:這個(gè)訓(xùn)練集您是以什么標(biāo)準(zhǔn)篩選的,有什么數(shù)據(jù)庫(kù)嗎?
C:開(kāi)源的有pubchem,chembl,bindingdb。
D:他的活性值在這些數(shù)據(jù)庫(kù)都有嗎?需要爬蟲(chóng)下來(lái)?
C:不需要爬蟲(chóng)啊, 直接可以按靶標(biāo)搜索。
E:現(xiàn)在什么靶標(biāo)比較火呀,我也做的深度學(xué)習(xí)的,描述符有很多。
殷賦科技:不應(yīng)該選經(jīng)典成熟的靶標(biāo)么?
E:用二維描述符+卷積神經(jīng)網(wǎng)絡(luò)。哪個(gè)靶標(biāo)有一萬(wàn)以上的小分子呢?
C:毒性,代謝是所有藥物上市前都研究的,這些靶標(biāo)比較多,比如hERG。
蛋白處理與分子對(duì)接A:請(qǐng)問(wèn)如果是鋅結(jié)合的抑制劑對(duì)接完成后做QM/MM除了將配體,鋅離子以及與鋅離子直接相連的三個(gè)氨基酸設(shè)為QM區(qū),那些與配體成氫鍵或是pi作用的氨基酸也要設(shè)為QM區(qū)嗎?
E:是的。
A:還有請(qǐng)問(wèn)對(duì)于配體的電荷怎么看啊?比如一個(gè)羧酸分子,是0嗎?
E:羧酸有H嗎?有H就是0。
A:請(qǐng)問(wèn)什么叫有氫嗎?我加了charmm力場(chǎng),羧酸那個(gè)O上面沒(méi)有H。
E:那是-1,你的qm是dft還是dftb?
A:我不懂,怎么看啊?我是在ds里做的。
E:我以為你是qm/mm/md!
A:不是,沒(méi)有做分子動(dòng)力學(xué)。你好,我的配體就是這樣的。
A:這個(gè)就算做-1是嗎?還有請(qǐng)問(wèn)組氨酸電荷是不是+1呢?我天冬氨酸按照-1算的。
E:HID,HIP還是HIE?看你質(zhì)子化情況。
A:HIS。怎么看質(zhì)子化啊?我是小白就是按教程做的。
殷賦科技:讓DS處理吧。用UCSF Chimera的Prep Dock就可以處理,我們平臺(tái)也會(huì)自動(dòng)處理蛋白,生成的mol2文件就含有質(zhì)子化氫和偏電荷(partial charge)。
F:你用什么做QMMM?
A:你好,我用的ds@F。下載的pdb晶體里面有一個(gè)配體很大,為了對(duì)接,清理蛋白質(zhì)的時(shí)候定義活性位點(diǎn)設(shè)定的半徑要不要相應(yīng)增大啊?
G:不知道具體的結(jié)合位點(diǎn)?
A:我就選中的原來(lái)配體設(shè)定的半徑。
H:原來(lái)的配體就是活性位點(diǎn),一般半徑設(shè)置10左右吧,半徑太大的話對(duì)接時(shí)間會(huì)長(zhǎng),另外結(jié)果不準(zhǔn)確,當(dāng)然半徑太小會(huì)對(duì)接不進(jìn)去,可以適當(dāng)調(diào)整。
A:你好,我看教程也是說(shuō)半徑設(shè)為10但是10的話我看無(wú)法全部包括原來(lái)的配體分子啊。
H:你可以適當(dāng)增大,12也可以。
I:你們用的什么軟件?我之前對(duì)接一個(gè)蛋白,用的原配體口袋,對(duì)接我的化合物打分挺高的,可是作用的氨基酸跟文獻(xiàn)差好多,這正常么?
A:ds,我主要是現(xiàn)在想要選一個(gè)好的晶體,把自帶的配體對(duì)接回去和本身的配體重疊查看一下rmsd值。
G:就是對(duì)接出來(lái)的結(jié)果不是那么準(zhǔn)確吧。
A:好多晶體對(duì)接回去都不好,我現(xiàn)在調(diào)大點(diǎn)半徑試試,先對(duì)上再說(shuō)。
I:我之前用薛定諤對(duì)接的效果不錯(cuò)。
A:我感覺(jué)你那種情況好像也挺正常,這種對(duì)接也不怎么準(zhǔn),尤其是ds。
I:后來(lái)用的DS對(duì)接效果一般,但是作用的蛋白跟我用薛定諤對(duì)接的差不多。
A:薛定諤好像是更靠譜一些。
I:做起來(lái)挺慢的。
A:你們有薛定諤的教程嗎?
I:我是跟別人學(xué)了兩天,也沒(méi)太搞明白。原來(lái)學(xué)校有個(gè)課題組做這個(gè)方向的,我畢業(yè)走了,我們學(xué)校開(kāi)始開(kāi)的計(jì)算機(jī)輔助藥物設(shè)計(jì)這門課了!
QSAR疊合構(gòu)象R:請(qǐng)問(wèn),做QSAR分子疊合的時(shí)候,有些疊合的不好該怎么搞呢,明明都差不多。殷賦科技:你指的是QSAR模型的預(yù)測(cè)能力不好吧?如果疊合不整齊,手動(dòng)調(diào)整咯。
R:你是說(shuō)調(diào)訓(xùn)練測(cè)試集嘛?
殷賦科技:你是說(shuō)結(jié)構(gòu)疊合得不好(不整齊)嗎?還是疊合后做出來(lái)的模型預(yù)測(cè)能力不好?
R:疊合出來(lái)的預(yù)測(cè)能力還行 confa的0.6幾,comsia的有0.7幾,就是疊合的不整齊。
殷賦科技:截圖看如何不整齊。
殷賦科技:你是不是認(rèn)為有部分結(jié)構(gòu)應(yīng)該左右反過(guò)來(lái)疊合才算整齊?
R:反倒是沒(méi)反。
殷賦科技:那就沒(méi)問(wèn)題啊。
G:這是什么軟件啊?
殷賦科技:SYBYL。
R:有幾個(gè)明明就一點(diǎn)差別,但是疊合出來(lái)就重合的不好。
殷賦科技:那是構(gòu)像問(wèn)題了,它已經(jīng)盡力了,但疊合是剛性的,構(gòu)像如此,它也很無(wú)奈啊。調(diào)整構(gòu)像唄,可以用你認(rèn)為合適的某個(gè)化合物來(lái)構(gòu)建相似結(jié)構(gòu)的結(jié)構(gòu),構(gòu)像就接近啦。
殷賦科技:或者產(chǎn)生大量構(gòu)像,然后用算法去挑選。我不知道SYBYL里邊有沒(méi)有這個(gè)功能。
R:我剛看了教程找到了你說(shuō)的利用構(gòu)象搜索去挑選疊合構(gòu)象@殷賦科技 感謝你的提醒。
虛擬篩選S:導(dǎo)師讓我做虛擬篩選這塊兒(學(xué)autodock) ,但是沒(méi)有頭緒,我也不怎么會(huì)python,請(qǐng)問(wèn)有這方面的課程么?
殷賦科技:我們博客上有個(gè)腳本,可以用用,不過(guò),并不建議新手去用腳本做篩選。因?yàn)橛?jì)算不是問(wèn)題,問(wèn)題是沒(méi)有經(jīng)驗(yàn)的人的命中率很低,浪費(fèi)的是買化合物做實(shí)驗(yàn)的錢。
S:有道理,之前同組的同學(xué)用svm篩選過(guò)酪氨酸酶抑制劑,酶一點(diǎn)點(diǎn)花了八千多。
殷賦科技:我們正在開(kāi)發(fā)在線方案,聯(lián)合使用vina和dock6對(duì)接,再加上根據(jù)以往經(jīng)驗(yàn)寫成的分析篩選腳本,能極大提高命中率。如果不著急,不妨等一等。
D:您說(shuō)的基于Vina和dock6對(duì)接,然后經(jīng)過(guò)分析后得到數(shù)據(jù)的腳本,這個(gè)分析是什么個(gè)過(guò)程?共同命中被選下來(lái)?這個(gè)的話腳本不難寫,如果這個(gè)思路可行的話我也想寫寫試一試。
殷賦科技:主要是兩步,一是根據(jù)打分挑選最好的化合物,二是根據(jù)結(jié)合模式挑選,前者容易實(shí)現(xiàn),后者則比較困難。
D:結(jié)合模式的話會(huì)把關(guān)鍵氨基酸以及結(jié)合對(duì)關(guān)鍵氨基酸的影響考慮進(jìn)去嗎?
殷賦科技:對(duì),分為一般相互作用(比比如氫鍵、pi-pi堆積)和特殊相互作用(針對(duì)該體系的關(guān)鍵氨基酸及其作用),還有口袋形狀的匹配程度HH。
靶標(biāo)預(yù)測(cè)圖G:大家有預(yù)測(cè)疾病靶點(diǎn)的那種圖嗎?我寫東西想用用。但是找不到啊。
F:舉個(gè)例子?
K:什么樣的圖?
殷賦科技 :大概要個(gè)網(wǎng)絡(luò)圖吧。
G:對(duì)就是網(wǎng)絡(luò)關(guān)系那種。
G:不用顯示具體的物質(zhì)。我就是想用一下這樣的圖。說(shuō)明一下預(yù)測(cè)靶點(diǎn)。
殷賦科技:化合物在中間,周圍是潛在的蛋白靶標(biāo),遠(yuǎn)近表示可能性大小。http://aAs.cytoscape.org/media/golorize/screenshots/Golorize.jpg。
更多資訊,請(qǐng)登錄www.yinfotek.com 或關(guān)注微信公眾號(hào)“殷賦科技”。我司建立了微信學(xué)術(shù)交流群,為生物醫(yī)藥領(lǐng)域的朋友搭建溝通交流的互動(dòng)平臺(tái)。想入群的朋友,請(qǐng)?jiān)谖⑿殴娞?hào)菜單欄輸入“加群”,根據(jù)提示操作即可。