北京生物/藥物信息學分析數(shù)據(jù)科學活動

來源: 發(fā)布時間:2022-01-23

    GeneInteraction基因互作:基因相互作用指miRNA、lncRNA、circRNA或其它RNA介導DNA轉(zhuǎn)錄,從而影響mRNA的表達過程。通俗意義上來說,基因互作關(guān)系指基于序列預測的靶基因?qū)ΑiRNA通過與靶mRNA的結(jié)合,或促使mRNA降解,或阻礙其翻譯,從而***目的基因的表達。競爭性內(nèi)源RNA網(wǎng)絡(luò)是靶基因預測的研究深入,簡稱ceRNA網(wǎng)絡(luò)。通過進行ceRNA網(wǎng)絡(luò)的分析,我們能從一個更為宏觀的角度來解釋轉(zhuǎn)錄體如何構(gòu)建基因表達調(diào)控網(wǎng)絡(luò),從而進一步挖掘基因在其中的調(diào)控機制?;驹恚簃iRNA主要通過與靶基因的非翻譯區(qū)(UTR)結(jié)合而發(fā)揮其作用,對miRNA和mRNA、lncRNA、circRNA結(jié)合進行的預測稱為靶基因預測。靶基因預測使用軟件根據(jù)miRNA和靶基因間的結(jié)合的規(guī)律預測結(jié)合基因?qū)ΑT谏矬w內(nèi),miRNA可以通過與proteincoding特異性結(jié)合,影響相關(guān)基因的表達,從而參與調(diào)控細胞內(nèi)的各項功能。ceRNA具有miRNA結(jié)合位點,能后競爭性地結(jié)合miRNA,***miRNA對靶基因的調(diào)控。例如lncRNA與miRNA競爭性結(jié)合,影響miRNA調(diào)控mRNA的過程,**終導致的mRNA表達失調(diào)。我們使用基于序列預測的軟件對差異分析得到的miRNA與mRNA,lncRNA,circRNA進行靶點預測和ceRNA網(wǎng)絡(luò)分析。 多鏈條批量處理、快速獲得研究靶點。北京生物/藥物信息學分析數(shù)據(jù)科學活動

    **突變頻譜分析(突變模式):目的:輸入突變數(shù)據(jù),用非負矩陣分解方法NMF分析突變特征,描述樣本集的突變模式。什么是突變模式:這也是對TCGA數(shù)據(jù)的深度挖掘,從而提出的一個統(tǒng)計學概念。文章(Signaturesofmutationalprocessesinhumancancer)研究了30種**,發(fā)現(xiàn)21種不同的mutationsignature。如果理解了,就會發(fā)現(xiàn)這個其實蠻簡單的,他們并不重新測序,只是拿已經(jīng)有了的TCGA數(shù)據(jù)進行分析,而且居然是發(fā)表在nature上面!文章研究了4,938,362mutationsfrom7,042cancers樣本,突變頻譜的概念只是針對于somatic的mutation。一般是對**病人的**組織和*旁組織配對測序,過濾得到的somaticmutation,一般一個樣本也就幾百個somatic的mutation。還有其它文章(Mutationalsignatures:thepatternsofsomaticmutationshiddenincancergenomes)也是這樣分析的從2013年提出到現(xiàn)在,已經(jīng)有30種mutationsiganures,在cosmic數(shù)據(jù)庫有詳細記錄,更新見:MutationalSignatures。它的概念就是:根據(jù)突變上下文分成96類,然后每類突變的頻率不一樣畫一個條形圖,可視化展現(xiàn)。應(yīng)用場景:突變特征定義:體細胞突變是多個突變過程如DNA修復缺陷,暴露于外源或內(nèi)源誘變劑等綜合結(jié)果。 山東生物/藥物信息學分析數(shù)據(jù)科學口碑推薦軟硬件配套,完成數(shù)據(jù)收集、整理、檢索、分析與智能化開發(fā)工作。

    **初目的:對手上的**樣本(或病人)進行分型分析,期望找到不同的亞型,并對應(yīng)不同的臨床特征??蓴U展應(yīng)用到:所有樣本的亞型分析,用于樣本的特征分析。數(shù)據(jù)可用轉(zhuǎn)錄組、基因組、甲基化、蛋白質(zhì)組等。輸入數(shù)據(jù)格式:一個數(shù)值矩陣,行是基因或者其他特征,列是樣本。本分析要求樣本數(shù)要多,有利于亞型的分析。參考文獻:(2)::本文利用室管膜瘤病人的甲基化數(shù)據(jù),首先進行了tSNE分型,隨后又采用了新的方法spectralclustering進行分類分析,作者比較了兩種分類方法。使用spectralclustering的分類,鑒定了每一種**亞型的特異性表達模式。并且發(fā)現(xiàn)spectralclustering的分類和病人的臨床特征有關(guān),從而提出一種新的室管膜瘤亞型,可用于臨床的篩選和檢測。

    單細胞測序數(shù)據(jù)挖掘:GEO目前收錄的單細胞研究樣本已經(jīng)超過2萬例,單細胞測序幾乎成為生物醫(yī)學領(lǐng)域CNS***文章的標配。實驗費用高昂,阻斷了CNS夢,既然其他數(shù)據(jù)可以挖,單細胞測序數(shù)據(jù)照樣可以挖。已知公共數(shù)據(jù)庫中單細胞測序數(shù)據(jù)涉及各種疾病類型,包括**、免疫細胞、炎癥類甚至神經(jīng)、肌肉、骨骼等,樣本豐富、數(shù)據(jù)龐大,你不挖就是失去了一座金山。我們提供各種設(shè)計單細胞測序、各種測序、芯片、多組學的公共數(shù)據(jù)庫挖掘、培訓、模型構(gòu)建、臨床統(tǒng)計、算法還原服務(wù);你能想到,我能做到;你提供參考文獻、思路和目的,我們提供結(jié)果;如果沒有思路,我們提供付費科研設(shè)計服務(wù)。示例如下:利用公共數(shù)據(jù)庫的1539個單細胞樣本,構(gòu)建自己的生物學故事。 按照斯普林格學術(shù)規(guī)范化處理準則提供文稿同行**投稿前意見評估。

棒棒糖圖是直觀顯示蛋白質(zhì)結(jié)構(gòu)上的突變點**簡單且有效的方式。許多致*基因具有比任何其他基因座更頻繁突變的優(yōu)先位點。這些位點被認為是突變熱點,棒棒糖圖可以用于顯示突變熱點以及其他突變位點。并可以對比不同**/亞型的突變位點。

基本原理

將蛋白質(zhì)結(jié)構(gòu)根據(jù)氨基酸順序繪制為長條形,以不同色塊標注不同結(jié)構(gòu)域,在基因突變導致氨基酸改變的位置標注棒棒糖,并在棒棒糖圓球標注位點的突變頻數(shù)以及突變位點。

數(shù)據(jù)要求

基因突變或者蛋白質(zhì)突變數(shù)據(jù)


下游分析

1、突變位點靶向藥物分析

2、驅(qū)動基因突變分析 檢測服務(wù)及數(shù)據(jù)分析助力取得2020年國自然面上十項、青年基金十八項。山東生物/藥物信息學分析數(shù)據(jù)科學口碑推薦

OmicCircos圖可以對感興趣的多個基因,展示其染色體的位置、拷貝數(shù)變異等多個特征。北京生物/藥物信息學分析數(shù)據(jù)科學活動

    GSVA(基因集變異分析,反映了樣本和感興趣的通路之間的聯(lián)系):GSVA全名Genesetvariationanalysis(基因集變異分析),是一種非參數(shù),無監(jiān)督的算法。與GSEA不同,GSVA不需要預先對樣本進行分組,可以計算每個樣本中特定基因集的富集分數(shù)。換而言之,GSVA轉(zhuǎn)化了基因表達數(shù)據(jù),從單個基因作為特征的表達矩陣,轉(zhuǎn)化為特定基因集作為特征的表達矩陣。GSVA對基因富集結(jié)果進行了量化,可以更方便地進行后續(xù)統(tǒng)計分析。如果用limma包做差異表達分析可以尋找樣本間差異表達的基因,同樣地,使用limma包對GSVA的結(jié)果(依然是一個矩陣)做同樣的分析,則可以尋找樣本間有***差異的基因集。這些“差異表達”的基因集,相對于基因而言,更加具有生物學意義,更具有可解釋性,可以進一步用于**subtype的分型等等與生物學意義結(jié)合密切的探究。 北京生物/藥物信息學分析數(shù)據(jù)科學活動