『壹』 什麼是知識圖譜
知識圖譜,是通過將應用數學、圖形學、信息可視化技術、信息科學等學科的理論與方法與計量學引文分析、共現分析等方法結合,並利用可視化的圖譜形象地展示學科的核心結構、發展歷史、前沿領域以及整體知識架構達到多學科融合目的的現代理論。
『貳』 中文知識圖譜的什麼是知識圖譜
允許用戶搜索搜索引擎知道的所有事物,人物或者地方,包括地標,名人,城市, 球隊,建築,地理特徵,電影,天體,藝術作品等等,而且能夠顯示關於你的查詢的實時信息。它是邁向下一代搜索業務關鍵的第一步,使得搜索智能化,根據用戶的意圖給出用戶想要的結果。 知識圖譜本質上是一種語義網路。其結點代表實體(entity)或者概念(concept),邊代表實體/概念之間的各種語義關系 知識圖譜相對於傳統的本體和語義網路而言,實體覆蓋率更高,語義關系也更加復雜而全面
『叄』 中文知識圖譜的介紹
中文知識圖譜(Chinese Knowledge Graph)1,最早起源於Google Knowledge Graph。知識圖譜本質上是一種語義網路。其結點代表實體(entity)或者概念(concept),邊代表實體/概念之間的各種語義關系。中文知識圖譜的直接推動力來自於一系列實際應用,包括語義搜索、機器問答、情報檢索、電子閱讀、在線學習等等。網路2、搜狗以及復旦大學GDM實驗室1相繼推出了其中文知識圖譜。
『肆』 知識圖譜有什麼用處
知識圖譜 (Knowledge Graph) 是當前的研究熱點。自從2012年Google推出自己第一版知識圖譜以來,它在學術界和工業界掀起了一股熱潮。各大互聯網企業在之後的短短一年內紛紛推出了自己的知識圖譜產品以作為回應。比如在國內,互聯網巨頭網路和搜狗分別推出」知心「和」知立方」來改進其搜索質量。那麼與這些傳統的互聯網公司相比,對處於當今風口浪尖上的行業 - 互聯網金融, 知識圖譜可以有哪方面的應用呢?
目錄
1. 什麼是知識圖譜?
2. 知識圖譜的表示
3. 知識圖譜的存儲
4. 應用
5. 挑戰
6. 結語
1. 什麼是知識圖譜?
知識圖譜本質上是語義網路,是一種基於圖的數據結構,由節點(Point)和邊(Edge)組成。在知識圖譜里,每個節點表示現實世界中存在的「實體」,每條邊為實體與實體之間的「關系」。知識圖譜是關系的最有效的表示方式。通俗地講,知識圖譜就是把所有不同種類的信息(Heterogeneous Information)連接在一起而得到的一個關系網路。知識圖譜提供了從「關系」的角度去分析問題的能力。
知識推理
推理能力是人類智能的重要特徵,使得我們可以從已有的知識中發現隱含的知識, 一般的推理往往需要一些規則的支持【3】。例如「朋友」的「朋友」,可以推理出「朋友」關系,「父親」的「父親」可以推理出「祖父」的關系。再比如張三的朋友很多也是李四的朋友,那我們可以推測張三和李四也很有可能是朋友關系。當然,這里會涉及到概率的問題。當信息量特別多的時候,怎麼把這些信息(side information)有效地與推理演算法結合在一起才是最關鍵的。常用的推理演算法包括基於邏輯(Logic) 的推理和基於分布式表示方法(Distributed Representation)的推理。隨著深度學習在人工智慧領域的地位變得越來越重要,基於分布式表示方法的推理也成為目前研究的熱點。如果有興趣可以參考一下這方面目前的工作進展【4,5,6,7】。
大數據、小樣本、構建有效的生態閉環是關鍵
雖然現在能獲取的數據量非常龐大,我們仍然面臨著小樣本問題,也就是樣本數量少。假設我們需要搭建一個基於機器學習的反欺詐評分系統,我們首先需要一些欺詐樣本。但實際上,我們能拿到的欺詐樣本數量不多,即便有幾百萬個貸款申請,最後被我們標記為欺詐的樣本很可能也就幾萬個而已。這對機器學習的建模提出了更高的挑戰。每一個欺詐樣本我們都是以很高昂的「代價」得到的。隨著時間的推移,我們必然會收集到更多的樣本,但樣本的增長空間還是有局限的。這有區別於傳統的機器學習系統,比如圖像識別,不難拿到好幾十萬甚至幾百萬的樣本。
在這種小樣本條件下,構建有效的生態閉環尤其的重要。所謂的生態閉環,指的是構建有效的自反饋系統使其能夠實時地反饋給我們的模型,並使得模型不斷地自優化從而提升准確率。為了搭建這種自學習系統,我們不僅要完善已有的數據流系統,而且要深入到各個業務線,並對相應的流程進行優化。這也是整個反欺詐環節必要的過程,我們要知道整個過程都充滿著博弈。所以我們需要不斷地通過反饋信號來調整我們的策略。
6. 結語
知識圖譜在學術界和工業界受到越來越多的關注。除了本文中所提到的應用,知識圖譜還可以應用在許可權管理,人力資源管理等不同的領域。在後續的文章中會詳細地講到這方面的應用。
參考文獻
【1】De Abreu, D., Flores, A., Palma, G., Pestana, V., Pinero, J., Queipo, J., ... & Vidal, M. E. (2013). Choosing Between Graph Databases and RDF Engines for Consuming and Mining Linked Data. In COLD.
【2】User Behavior Tutorial
【3】劉知遠 知識圖譜——機器大腦中的知識庫 第二章 知識圖譜——機器大腦中的知識庫
【4】Nickel, M., Murphy, K., Tresp, V., & Gabrilovich, E. A Review of Relational Machine Learning for Knowledge Graphs.
【5】Socher, R., Chen, D., Manning, C. D., & Ng, A. (2013). Reasoning with neural tensor networks for knowledge base completion. In Advances in Neural Information Processing Systems (pp. 926-934).
【6】Bordes, A., Usunier, N., Garcia-Duran, A., Weston, J., & Yakhnenko, O. (2013). Translating embeddings for modeling multi-relational data. In Advances in Neural Information Processing Systems (pp. 2787-2795).
【7】Jenatton, R., Roux, N. L., Bordes, A., & Obozinski, G. R. (2012). A latent factor model for highly multi-relational data. In Advances in Neural Information Processing Systems(pp. 3167-3175).
『伍』 知網可視化分析圖怎麼下載
知網的文檔格式為CAJ,裡面的文字和圖片都是不能下載的,只能用於參考查閱。
可視化圖標有數據圖,點狀分布圖,線性圖用於查看自我數據變化,柱狀圖用於看同類型數據對比,餅狀圖用於分析個體在全局中的佔比。可視化分析圖譜意思是指將大量的數據、信息、知識轉化為一種人類的視覺形式,直觀、形象的表現、解釋和分析。
視化圖標及其特點
柱形圖利用柱子的高度,能夠比較清晰的反映數據的差異,一般情況下用來反映分類項目之間的比較,也可以用來反映時間趨勢。折線圖用來反映隨時間變化的趨勢。當我們需要描述事物隨時間維度的變化時常常需要使用該圖形。
通常折線圖描繪的點越多,越能夠清楚的觀察到數據的變化趨勢。方便決策者及時做出決策。餅圖的使用應該慎重,因為肉眼對面積大小感應不敏感。是最容易被誤用的。但在具體反映某個比重的時候,配上具體數值,會有較好的效果。在需要描述某一部分佔總體的百分比時,適合使用餅圖。
但對比的數量最多不能超過6個,否則會產生視覺的混亂。散點圖的數據為三維數據,使用兩組數據構成多個坐標點,分析坐標點的分布情況,判斷兩個變數之間的關聯或分布趨勢。適合於觀測大量數據的分布特點,對於視覺的直觀性更強。點與點之間的密集度反應著該區域的整體權重比例。
『陸』 如何構建知識圖譜
自己建嗎可以下載圖譜軟體構建
http://www.cnblogs.com/R0b1n/p/5224065.html可以參考一下這個
SPSS: 大型統計分析軟體,商用軟體。具有完整的數據輸入、編輯、統計分析、報表、圖形繪制等功能。常用於多元統計分析、數據挖掘和數據可視化。
Bibexcel: 瑞典科學計量學家Persoon開發的科學計量學軟體,用於科學研究免費軟體。具有文獻計量分析、引文分析、共引分析、耦合分析、聚類分析和數據可視化等功能。可用於分析ISI的SCI、SSCI和A&HCI文獻資料庫。
HistCite: Eugene Garfield等人於2001年開發的科學文獻引文鏈接分析和可視化系統,免費軟體。可對ISI的SCI、SSCI和SA&HCI等文獻資料庫的引文數據進行計量分析,生成文獻、作者和期刊的引文矩陣和實時動態引文編年圖。直觀的反映文獻之間的引用關系、主題的宗譜關系、作者歷史傳承關系、科學知識發展演進等。
CiteSpace: 陳超美博士開發的專門用於科學知識圖譜繪制的免費軟體。國內使用最多知識圖譜繪制軟體。可用於追蹤研究領域熱點和發展趨勢,了解研究領域的研究前沿及演進關鍵路徑,重要的文獻、作者及機構。可用於對ISI、CSSCI和CNKI等多種文獻資料庫進行分析。
TDA: Thomson Data Analyzer(TDA)是Thomson集團基於VantagePoint開發文獻分析工具。商用軟體。具有去重、分段等數據預處理功能;可形成共現矩陣、因子矩陣等多種分析矩陣;可使用Pearson、Cosine等多種演算法進行數據標准化;可進行知識圖譜可視化展示。
Sci2 Tools: 印第安納大學開發的用於研究科學結構的模塊化工具可從時間、空間、主題、網路分析和可視化等多角度,分析個體、局部和整體水平的知識單元。
ColPalRed: Gradnada大學開發的共詞單元文獻分析軟體。商用軟體。結構分析,在主題網路中展現知識(詞語及其關系);戰略分析,通過中心度和密度,在主題網路中為主題定位;動態分析,分析主題網路演變,鑒定主題路徑和分支。
Leydesdorff: 系類軟體。阿姆斯特丹大學Leydesdorff開發的這對文獻計量的小程序集合。處理共詞分析、耦合分析、共引分析等知識單元體系。使用「層疊圖」實現可視化知識的靜態布局和動態變化。
Word Smith: 詞頻分析軟體。可將文本中單詞出現頻率排序和找出單詞的搭配片語。
NWB Tools: 印第安納大學開發的對大規模知識網路進行建模、分析和可視化工具. 數據預處理;構建共引、共詞、耦合等多種網路;可用多種方法進行網路分析;可進行可視化展示.
Ucinet NetDraw: Ucinet是社會網路分析工具。包括網路可視化工具Net Draw。用於處理多種關系數據,可通過節點屬性對節點的顏色、形狀和大小等進行設置。用於社交網路分析和網路可視化。
Pajek: 來自斯洛維尼亞的分析大型網路的社會網路分析免費軟體。Pajek基於圖論、網路分析和可視化技術,主要用於大型網路分解,網路關系展示,科研作者合作網路圖譜的繪制。
VOSviewer: 荷蘭萊頓大學開發的文獻可視化分析工具。使用基於VOS聚類技術技術實現知識單元可視化工具。突出特點可視化能力強,適合於大規模樣本數據。四種視圖瀏覽:標簽視圖、密度視圖、聚類視圖和分散視圖。
[4]陳悅, 劉則淵, 陳勁等. 科學知識圖譜的發展歷程[J]. 科學學研究, 2008, (03): 449-460.
[5]Shiffrin, R.M., and Katy Börner. Mapping Knowledge Domains[C]. Proc. Proceedings of the National Academy of Sciences of the United States of America pp. 5183-5185.
[6]Börner, K., Chen, C.和Boyack, K.W. Visualizing knowledge domains[J]. Annual review of information science and technology, 2003, 37, (1): 179-255.
[7]CM, C. CiteSpace II: Detecting and visualizing emerging trends and transient patterns in scientific literature[J]. Journal of the American Society for Information Science and Technology, 2006, 57, (3): 359-377.
[8]陳悅和劉則淵. 悄然興起的科學知識圖譜[J]. 科學學研究, 2005, (02): 149-154.
[9]邱均平. 信息計量學[M]. (武漢大學出版社, 2007. 2007).
[10]沙勇忠和牛春華. 信息分析[M]. (科學出版社, 2009. 2009).
[11]塞沃爾, 建軍和煦. 鏈接分析: 信息科學的研究方法[M]. (東南大學出版社, 2009. 2009).
[12]Egghe, L.和Rousseau, R. Introction to informetrics: Quantitative methods in library, documentation and information science[J]. 1990
[13]韓家煒, 坎伯, 裴健等. 數據挖掘: 概念與技術[M]. (機械工業出版社, 2007. 2007).
[14]Wasserman, S. Social network analysis: Methods and applications[M]. (Cambridge university press, 1994. 1994).
[15]Persson, O., R. Danell, J. Wiborg Schneider. How to use Bibexcel for various types of bibliometric analysis[C]. Proc. International Society for Scientometrics and Informetrics., Leuven, Belgium2009 pp. 9–24.
[16]Yang, Y., Akers, L., Klose, T.等. Text mining and visualization tools–impressions of emerging capabilities[J]. World Patent Information, 2008, 30, (4): 280-293.
[17]Börner, K., Huang, W., Linnemeier, M.等. Rete-netzwerk-red: analyzing and visualizing scholarly networks using the Network Workbench Tool[J]. Scientometrics, 2010, 83, (3): 863-876.
[18]廖勝姣. 科學知識圖譜繪制工具:SPSS和TDA的比較研究[J]. 圖書館學研究, 2011, (05): 46-49.
[19]Scott, M. WordSmith tools[M]. (Oxford: Oxford University Press, 1996. 1996).
[20]Batagelj, V.和Mrvar, A. Pajek - Program for Large Network Analysis[M]. (1998. 1998).
[21]Borgatti, S.P., Everett, M.G.和Freeman, L.C. Ucinet for Windows: Software for social network analysis[J]. 2002
[22]Van Eck, N.J.和Waltman, L. VOSviewer: A computer program for bibliometric mapping[J]. 2009
『柒』 知識圖譜是什麼有哪些應用價值
知識圖譜 (Knowledge Graph) 是當前的研究熱點。自從2012年Google推出自己第一版知識圖譜以來,它在學術界和工業界掀起了一股熱潮。各大互聯網企業在之後的短短一年內紛紛推出了自己的知識圖譜產品以作為回應。比如在國內,互聯網巨頭網路和搜狗分別推出」知心「和」知立方」來改進其搜索質量。那麼與這些傳統的互聯網公司相比,對處於當今風口浪尖上的行業 - 互聯網金融, 知識圖譜可以有哪方面的應用呢?
目錄
1. 什麼是知識圖譜?
2. 知識圖譜的表示
3. 知識圖譜的存儲
4. 應用
5. 挑戰
6. 結語
1. 什麼是知識圖譜?
知識圖譜本質上是語義網路,是一種基於圖的數據結構,由節點(Point)和邊(Edge)組成。在知識圖譜里,每個節點表示現實世界中存在的「實體」,每條邊為實體與實體之間的「關系」。知識圖譜是關系的最有效的表示方式。通俗地講,知識圖譜就是把所有不同種類的信息(Heterogeneous Information)連接在一起而得到的一個關系網路。知識圖譜提供了從「關系」的角度去分析問題的能力。
知識推理
推理能力是人類智能的重要特徵,使得我們可以從已有的知識中發現隱含的知識, 一般的推理往往需要一些規則的支持【3】。例如「朋友」的「朋友」,可以推理出「朋友」關系,「父親」的「父親」可以推理出「祖父」的關系。再比如張三的朋友很多也是李四的朋友,那我們可以推測張三和李四也很有可能是朋友關系。當然,這里會涉及到概率的問題。當信息量特別多的時候,怎麼把這些信息(side information)有效地與推理演算法結合在一起才是最關鍵的。常用的推理演算法包括基於邏輯(Logic) 的推理和基於分布式表示方法(Distributed Representation)的推理。隨著深度學習在人工智慧領域的地位變得越來越重要,基於分布式表示方法的推理也成為目前研究的熱點。如果有興趣可以參考一下這方面目前的工作進展【4,5,6,7】。
大數據、小樣本、構建有效的生態閉環是關鍵
雖然現在能獲取的數據量非常龐大,我們仍然面臨著小樣本問題,也就是樣本數量少。假設我們需要搭建一個基於機器學習的反欺詐評分系統,我們首先需要一些欺詐樣本。但實際上,我們能拿到的欺詐樣本數量不多,即便有幾百萬個貸款申請,最後被我們標記為欺詐的樣本很可能也就幾萬個而已。這對機器學習的建模提出了更高的挑戰。每一個欺詐樣本我們都是以很高昂的「代價」得到的。隨著時間的推移,我們必然會收集到更多的樣本,但樣本的增長空間還是有局限的。這有區別於傳統的機器學習系統,比如圖像識別,不難拿到好幾十萬甚至幾百萬的樣本。
在這種小樣本條件下,構建有效的生態閉環尤其的重要。所謂的生態閉環,指的是構建有效的自反饋系統使其能夠實時地反饋給我們的模型,並使得模型不斷地自優化從而提升准確率。為了搭建這種自學習系統,我們不僅要完善已有的數據流系統,而且要深入到各個業務線,並對相應的流程進行優化。這也是整個反欺詐環節必要的過程,我們要知道整個過程都充滿著博弈。所以我們需要不斷地通過反饋信號來調整我們的策略。
6. 結語
知識圖譜在學術界和工業界受到越來越多的關注。除了本文中所提到的應用,知識圖譜還可以應用在許可權管理,人力資源管理等不同的領域。在後續的文章中會詳細地講到這方面的應用。
參考文獻
【1】De Abreu, D., Flores, A., Palma, G., Pestana, V., Pinero, J., Queipo, J., ... & Vidal, M. E. (2013). Choosing Between Graph Databases and RDF Engines for Consuming and Mining Linked Data. In COLD.
【2】User Behavior Tutorial
【3】劉知遠 知識圖譜——機器大腦中的知識庫 第二章 知識圖譜——機器大腦中的知識庫
【4】Nickel, M., Murphy, K., Tresp, V., & Gabrilovich, E. A Review of Relational Machine Learning for Knowledge Graphs.
【5】Socher, R., Chen, D., Manning, C. D., & Ng, A. (2013). Reasoning with neural tensor networks for knowledge base completion. In Advances in Neural Information Processing Systems (pp. 926-934).
【6】Bordes, A., Usunier, N., Garcia-Duran, A., Weston, J., & Yakhnenko, O. (2013). Translating embeddings for modeling multi-relational data. In Advances in Neural Information Processing Systems (pp. 2787-2795).
【7】Jenatton, R., Roux, N. L., Bordes, A., & Obozinski, G. R. (2012). A latent factor model for highly multi-relational data. In Advances in Neural Information Processing Systems(pp. 3167-3175).
『捌』 citespace怎麼根據檢索結果繪制知識圖譜
CiteSpace的核心功能是產生由多個文獻共被引網路組合而成的一種獨特的共被引網路,以及自動生成的一些相關分析結果。每個文獻共被引網路對應於一個歷時一年或幾年的時間段。最終顯示的網路不是各個網路之間的簡單疊加
『玖』 知識圖譜概念是什麼
知識圖譜本質上是語義網路,是一種基於圖的數據結構,由節點(Point)和邊(Edge)組成。
知識圖譜又稱為科學知識圖譜,其本質上是語義網路,是一種基於圖的數據結構,由節點(Point)和邊(Edge)組成。知識圖譜通過將應用數學、圖形學、信息可視化技術、信息科學等學科的理論與方法與計量學引文分析、共現分析等方法結合。
構建方式
知識圖譜有自頂向下和自底向上兩種構建方式。所謂自頂向下構建是藉助網路類網站等結構化數據源,從高質量數據中提取本體和模式信息,加入到知識庫中;所謂自底向上構建,則是藉助一定的技術手段,從公開採集的數據中提取出資源模式,選擇其中置信度較高的新模式,經人工審核之後,加入到知識庫中。
以上內容參考:網路-知識圖譜
『拾』 CNKI學術圖片知識庫怎麼可以免費瀏覽呀
這個沒有的
目前CNKI
正在各個高校推廣免費試用活動,在學校IP范圍內是可以免費登錄的