应用社会网路分析于学术社群推荐课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《应用社会网路分析于学术社群推荐课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 社会 网路 分析 学术 社群 推荐 课件
- 资源描述:
-
1、1應用社會性推薦於學術社群 Using Social Recommendation in Academic Community柯皓仁國立台灣師範大學圖書資訊學研究所粘怡祥國立交通大學資訊管理研究所2大綱緒論相關文獻研究方法系統發展與實證分析結論與建議3緒論4研究背景與動機資訊過載(Information Overload)搜尋引擎與推薦系統的出現,成為改善資訊過載問題的兩大利器使用者除本身的主觀喜好之外,其為容受到人際關係的影響虛擬社群與社會網,成為許多使用者獲得資訊情報的最佳來源本研究探討如何運用社會網路提升資訊推薦的品質5研究目的本研究希望透過主題概念萃取與社會網路分析,建構資訊推薦系統,
2、藉此達到以下的目標:主題概念萃取:萃取出文件中的重要關鍵字用關鍵字分群的方式,達到主題概念萃取的目的,藉以瞭解使用者所關注的興趣與議題形成主題社群以向空間模型表示使用者的個別興趣,並結合使用者社會網路,將相似高且具有相同主題興趣的使用者群聚在一起,以形成主題社群資訊推薦經由主題社群的產生,針對使用者個人的主題偏好,進行個人化推薦6相關研究7社會網路分析社會網路分析(Social Network Analysis)是一種研究社會結構、組織系統、人際關係、團體互動的概與方法,是在社會計學基礎上所發展出的分析方法社會網路分析研究域中,最著名的之一為度分隔理論40最初利用信件傳遞實驗,發現從寄件者到收
3、件者之間,平均轉寄次指互不相干的個人,最多可經由五個中介者結出某種關係8社會網路示意圖http:/en.wikipedia.org/wiki/Social_network 9社會網路分析(Cont.)在社會網路分析中,個別行動者的量測指標主要有以下三項21:Degreenumber of direct connectionsBetweennessrole of broker or gatekeeperCloseness Centralitywho has the shortest path to all others1():the edge for vertex to vertex hijji
4、jd immij1,():the number of geodesics between and that contain :the number of geodesics between and njikjkijkjikjkgb iggjkigjk11():the shortest path of to Njijijc iddij10Clustering AlgorithmPartitioning methodsk-Means Hierarchical methodsAgglomerative Divisive Model-based methodsSelf-Organizing Map 1
5、1Clustering Algorithm(續)Partitioning methodsk-Means Hierarchical methodsAgglomerative Divisive Model-based methodsSelf-Organizing Map12Clustering Algorithm(續)Partitioning methodsk-MeansHierarchical methodsAgglomerativeDivisiveModel-based methodsSelf-Organizing Map13推薦系統推薦系統的目的是從大量資訊中找出使用者最可能感興趣的部份,減
6、少使用者主動搜尋的機會成本目前常應用在推薦系統的方法主要有兩種內容導向(Content-based)式推薦協同過濾(Collaborative Filtering)式推薦14資訊檢索向量空間模型The vector model ranks the documents according to their degree of similarity to the query,and retrieve the documents with a degree of similarity above a thresholdDefineWeight wi,j associated with a pair(
7、ki,dj)is positive and non-binary (t is the total number of index terms)The index terms in the query are also weightedwi,q is the weight associated with the pair ki,q,where wi,q=0 (t is the total number of index terms)Degree of similarity of dj with regard to q:The cosine of the angle between the two
8、 corresponding vectors).,(,2,1jtjjjwwwd).,(,2,1qtqqwwwq tiqitijitiqijiwwwwqq1,21,21,jjjddq),sim(d15資訊檢索向量空間模型圖示NormalizedTerm-document matrix16資訊檢索向量空間模型圖示17研究方法18語料庫本研究以交通大學機構典藏系統 38所收集的期刊文做為語庫選取標題(Title)、摘要(Abstract)、關鍵字(Keyword)及作者(Author)欄位做為資源http:/ir.lib.nctu.edu.tw 系統雛型展示19前置處理斷詞字(Tokenizatio
9、n)與小寫化(Lowercasing)刪除停用字(Stopword Removing)詞性標記(Part-of-speech)片語化(Chunking)詞幹還原(Stemming)特徵選擇(Feature Selection)20Some combinatorial characteristics of matrix multiplication on regular two-dimensional arrays are studied.From the studies,the authors are able to design many efficient varieties of the
10、 cylindrical array and the two-layered mesh array for matrix multiplication.some combinatorial characteristics of matrix multiplication on regular two-dimensional arrays are studied from the studies the authors are able to design many efficient varieties of the cylindrical array and the two-layered
11、mesh array for matrix multiplicationsome combinatorial characteristics of matrix multiplication on regular two-dimensional arrays are studied from the studies the authors are able to design many efficient varieties of the cylindrical array and the two-layered mesh array for matrix multiplicationcomb
12、inatorial characteristics matrix multiplication regular two-dimensional arrays studied studies authors design efficient varieties cylindrical array two-layered mesh array matrix multiplicationcombinatorial_jj characteristics_nns matrix_nn multiplication_nn regular_jj two-dimensional_jj arrays_nns st
13、udied_vbn studies_nns authors_nns design_vb efficient_jj varieties_nns cylindrical_jj array_nn two-layered_jj mesh_nn array_nn matrix_nn multiplication_nnPOSPhrasenounnounnounverbnounnounverbnounnounnounnouncombinatorial characteristicsmatrix multiplicationregular two-dimensional arraysstudiedstudie
14、sauthordesignefficient varieties cylindrical arraytwo-layered mesh arraymatrix multiplicationPOSPhrasenounnounnounverbnounnounverbnounnounnounnouncombinatori characteristmatrix multiplregular two-dimension arraistudistudiauthordesigneffici varieticylindr arraitwo-lay mesh arraimatrix multipl前置處理(續)2
15、1主題關鍵字分群使用者模型計算語意相關度建立語意網路圖關鍵字分群關鍵字分群標記22使用者模型採用TF-IAF(Term Frequency-Inverse Author Frequency)30來衡量使用者與關鍵字間的關聯計算完TF-IAF後,每個使用者皆可以向量的形式來呈現12(,.,),if term is associated with author ,otherwise:#of keywordsjjjjmijiijUwwwtfiafijwm 2frequency of termassociated with author of authorslog:of author that use
16、 the term ijiiiiijijitffreqijNNiafninwtfiaf 23計算語意相關度本研究以子為範圍,即個關鍵字在同一子內出現才表示其具有語意相關。透過增加標題(Title)及關鍵字(Keyword)權重強化這些關鍵字關係之代表性1,if&arebothin title or keyword(),otherwisemax(),()ijijijijttf ttrf tf t 24建立語意網圖每個關鍵字可表示為一個點,點權重為個別關鍵字在使用者間TF-IAF的加總,再加上該關鍵字所有語意相關度平均關鍵字間的關係表示成一個邊,邊權重即為關鍵字的語意相關度運用9的方法進行主題關鍵
17、字分群11 o f au th o rs:th e d eg ree o f vertex NiijjhijjiiiwwrC WwhNhv25建立語意網路圖26主題關鍵字分群示意圖927選取重要候選關鍵字Finding vertices whose weights are larger than the average weight28主題關鍵字分群(Cont.)k-Nearest Neighbor Approach19考慮圖中的每個點,取與該點最相近的k個點為一組,每組為一個通圖,稱之為候選關鍵字組產生候選關鍵字子群以每個候選關鍵字組為中心,向外還原先前與候選關鍵字組內的點有直接線關係的邊,
18、形成候選關鍵字子群,並計算每個子群的權重,如方程式(3-6)所示。kijkGijrGWr(3-6)29關鍵字分群Use k-nearest neighbor graph approach30主題關鍵字分群(Cont.)合併候選關鍵字子群找出互性(Inter-connectivity)最強的個子群將之合併,直到子群間的互相關(Relative Inter-connectivity)小於門檻值後停止。互相關度方程式(3-7)所示。(,)|(,)|ijijE G GijGGWRI G GWW(3-7)31合併候選關鍵字子群,(,)ijiE G GijGGjWRI G GWW32主題關鍵字分群(Con
19、t.)修正並產生主題關鍵字分群讓每個子群內的關鍵字個保持在一定的差距內子群內包含的關鍵字比平均個數少,但子群權重卻大於平均權重時,將該群保子群經修正後仍小於平均權重,將該群直接刪除子群權重如方程式(3-8)所示|()|()(|()|()1|)/2()|()|()()ijijrGE GCD GV GV GrAS GE GCWCD GAS G(3-8)33修正並產生主題關鍵字分群 CWCD GAS G 12E GCD GV GV G ijijrE GrAS GE G34關鍵字分群標記利用人過出有意義的關鍵字取權重最高的關鍵字做為最後群的標記35建立主題社群使用者社會網路使用者分群36使用者社會網路
20、1,if user is one of the authors in document 0,otherwiseijijW 0 0 10 1 0 12 2 01 1 00 1 1 12 3 10 1 11 0 1 00 1 21 1 0TSWW:number of co-author publications between author and author ijSij37使用者社會網路(續)(,)|ijijijijSJ UUWWS10,*,1RijotherwiseJjiifij38使用者分群將所有使用者向量模型以Nm的矩陣U表示,N代表使用者數目,m代表所有關鍵字數目以矩陣R代表使用者間相
21、關係數,乘上以使用者向量模型構成的矩陣U,形成一新的矩陣U代表更新後的使用者向量模型(參數調整R的影響程度)111212122212 .U=.mmNNNmwwwwwwwww1112111121111212122221222212221212 .U=.NmmNmmNNNNNNNmRRRwwwwwwRRRwwwwwwRRRwww 12 .NNNmwww39使用者分群(續)以餘弦相似度(Cosine Similarity)計算使用者與個別主題的相似度,當使用者與主題間的相似度大於門檻值時,則將其歸類到該主題1212(,.,)where 1,2,.,:the weight of keywordasso
22、ciated with user :#of users:#of keywords(,.,)where 1,2,.,if ke jjjjmijkkkkmkmUwwwjNwijNmCtttkpt 12yword,otherwise:#of clusters,.,1,2,.,;1,2,.,kjkjjjkiCpSUsim UCsim UCsim UCwhere jNkp 40推薦模式在社群中的成員都具有相似的主題興趣,但是由於多重主題9的屬性存在,使得使用者可能對多種主題都具有偏好,於是產生個人化推薦與社群推薦兩種推薦模式,茲分述如下:個人化推薦(Collaborative Filtering)依據內
23、容導向方法,對使用者進行論文推薦,即計算社群內成員所撰寫的論文與個別成員的相似度,選取相似度最高的n篇論文給予推薦社群推薦(擴展閱讀層面)透過分析社群成員對其他主題的興趣分佈,統計出具有較高偏好比重的主題,推薦項目以與該主題最相關的n篇論文41系統發展與實證分析42系統發展系統架構43系統發展系統介面44系統發展系統介面(續)45系統發展系統介面(續)46系統發展系統介面(Cont.)47系統發展系統介面(續)48實驗結果分群結果評估首先將系統分群的結果分類,即將相近的群歸屬於同一類依序對個別使用者進行分類之動作採用準確(Precision)與回現(Recall)兩項指標15,來評估分群結果的
24、好壞Relevant RetrievedPrecision=Retrieved authorsRelevant RetrievedRecall=Relevant authors49Class labelCluster labelNetwork CommunicationMobile ComputingRouting ProtocolPIM-SMBandwidth RequestsTCPNetwork ManagementArtificial IntelligenceGenetic AlgorithmNetwork MotifBrick Motif Content AnalysisNeural
25、NetworkSPDNNDivide-and-conquer LearningComputer GraphicsContent-based Image RetrievalWatershed SegmentationToboggan ApproachInformation RetrievalSemantic QueryContent ManagementComputer SystemMemory CacheParallel Algorithm Information SecurityEnd-to-end SecurityGraph TheoryInterconnection NetworkSof
展开阅读全文