医疗资料探勘研讨报告一课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《医疗资料探勘研讨报告一课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医疗 资料 探勘 研讨 报告 课件
- 资源描述:
-
1、OutlinenCluster of Cases of Severe Acute RespiratorySyndrome in Hong Kongn醫療資料探勘研討報告醫療資料探勘研討報告 何謂基因 基因定序 SARS基因定序 nOpinionResults醫療資料探勘研討報告醫療資料探勘研討報告(一一)何謂基因 n基因是細胞核內染色體上一段“有意義”的DNA(去氧核醣核酸)序列n所謂有意義 DNA,是指這段DNA可經由轉錄(Transcribe)和轉譯(Translate)的過程,形成特殊序列的氨基酸(AnimoAcid)n完整序列的氨基酸就是大家常聽到的蛋白質 nDNA是由四種鹼基(bas
2、es)所構成,分別由A、T、G、C所代表nDNA是雙股螺旋結構,上下兩股必須對應,而對應的規則是A配T,G配C n基因組是組成內含生命指令的去氧核醣核酸()的基因組合n人體內約有三十一億二千萬對鹼基,構成三萬五千到四萬個基因n基因是由鹼基對構成的群組,每個基因就是構成一個生命的單一指令n有缺陷的基因會導致各種疾病n人體估計有八萬到十二萬個基因n存在於廿三對染色體當中,是決定遺傳特徵的基本單位n每一個基因都代表一組建構生物個體的遺傳訊息,並透過A、G、T、C四種密碼序列組合,製造特定結構的蛋白質,來執行複雜的生物功能n估計人類共有三十億個遺傳密碼序列,只要全部解讀出來,就可知道構成人體的基因是什
3、麼,並進而建構人體藍圖的每一細節n人類有廿三對染色體、約卅億鹼基對(鹼基對是基因組成的基本單位)n定序方式是把染色體打成每片約含三千五百鹼基對的碎片,讀取碎片兩頭五百到一千鹼基對,進行比對n若在不同碎片讀到完全一樣序列,就把一樣的地方重疊後,將兩段碎片接起來,逐步排列出完整基因序列n米色雙螺旋代表雙股鹼基n彩色橫條紋代表連結兩對應鹼基的氫鍵n每十對鹼基的DNA會剛好旋轉360度n並不是這1,700對的DNA都會表達出來n只有我們用黃色部份表示的DNA大約400對會被表達n而經過轉錄和轉譯的過程,形成如下所示的胰島素氨基酸序n列:MALWMRLLPLLALLALWGPDPAAAFVNQHLCGS
4、HLVEALYLVCGERGFFYTTPKTRREAEDLQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCNn未被表達出來的基因序列並非毫無作用n它們負責調控基因表達的強弱、時機等等n例如在人體內每一個細胞的胰島素基因都完全相同,可是,只有胰臟裏的蘭氏小島裏的細胞能夠實際產生胰島素n主要原因就是在其他細胞(包括剛才例中的外皮細胞)內,胰島素的基因表達是OFF,而在細胞是ON。n人類中的DNA有99.9%都相同。不論是愛因斯坦還是比爾蓋茲,都有同樣14萬個左右的基因,位於23對染色體上的固定位置。n剩下的0.1%的差異,雖然比率很小,可是人有30億
5、對鹼基,0.1%的變化也代表了多達3百萬不同的排列組合,影響每個人所遺傳的各種特性,例如膚色、眼睛的顏色、身高、個性及智力等。n人和黑猩猩的DNA只有1%到2%的不同而已n科學家可以由基因的相似度和差異度去探討生物種類之間的演化關係n細胞生物例如酵母菌和人之間仍存在許多非常相似的重要的基因,因此藉由研究這些基因在酵母菌內的作用,來推論這些基因在人體內的功能n每個人的基因不同,DNA控制每個人的遺傳特性,解碼之後,知道人體有30多億個位點,每個位點有四種可能(A、G、T、C)在不同的人體上,DNA差異約有千分之一,但是DNA差異分為很多種有單一位點差異(SNP)片段重覆次數不同的差異等,但是SN
6、P的比重最大,占所有DNA差異的九成以上n個體化醫療就是在這樣的趨勢下產生n每個人的DNA不一樣,所以外貌、體質不同,適合的藥物也不同,基因解碼後,提供了量化基因差異的技術基礎基因定序 n由於基因組是建構生物個體的藍圖,因此要完全瞭解一個生物個體中所有的生命現象n其先決條件就是要知道這個生物個體中基因組所有的DNA核序列n從七年代開始,科學家們就汲汲於追求對某些簡單生物基因的完全定序n最早基因被完全定序的生物是一種叫作174的噬菌體n噬菌體的基因全部只有5,386個鹽基對(base-pair)n一九七七年英國劍橋大學的Sanger教授首先完成它的基因定序n一九八二年,Sanger教授又完成了一
7、個比較大的基定序(共有4萬8千個鹽基對),叫作噬菌體的基因定序n隨後陸續有一些更大的基因組,像巨細胞病毒(Cytomegalovirus,23萬個鹽基對)、天花病毒(smallpox,18萬6千個鹽基對)、粒線體(mitochondria,18萬7千個鹽基對)和葉綠體(Choloroplast,12萬1千個鹽基對)等的基因被完全定序基因研究歷史 n人類基因組解碼計劃(HumanGenomeProject,又稱為基因組定序計劃)是基因科學領域至今最龐大的合作研究計劃n基因組計劃主要的目標,是解讀構成人類二十三對染色體所記錄的鹼基(nucleotide)n並尋找出多達十四萬各別基因(gene)的位
8、置及功能n計劃最早的構想始於八十年中期n在學術界廣泛的研議後n美國國家衛生院(NationalInstitutesofHealth)為首的機構,開始進行解碼計劃的組織和草案n基因組解碼計劃的第一階段定位於原始的基因定序n所謂基因定序,就是找出每一個DNA(去氧核醣核酸)中,由四種鹼基A、T、C、G所組成的遺傳密碼排序n目前所知,人類的二十三對染色體當中,由A、T、C、G兩兩配對的鹼基排列,總共超過了七十兆種n目前為止,以美國為首和英、德、法、日等十五個國家,超過六十個各別的大學和研究機構,正分工進行鹼基的定序工作n在官方及學界的支持下,這項國際性的基因定序工作的初步目標,預定將在1998-20
9、03內達成n初稿在2000年就已經出來了n由於計劃的時程不斷地超前,以及相關生化,工程和電腦技術的進步n負責總單位美國國家人類基因研究院(NationalHumanGenomeResearchInstitute),對於基因組計劃的進度和目標,先後修改了兩次n在一九九O年最初的規劃中,基因定序的工程估計要花費十五年以上,而主持單位只打算集中相關的研究資源投入重點目標n在一九九三年和九八年,基因組計劃的目標分別被擴大和增加n最新的章程不僅包函了原始的基因定序,還新增了對於各基因組在染色體上的區分和定位,並且還有多項研究試圖要了解它們所扮演的遺傳密碼的內容n為了推動和加速多達三十億人類鹼基的解碼,美
展开阅读全文