立即參團

  原價¥899.00

  50人以上 ¥499.00

  100人以上 ¥399.00

  

  《知識圖譜》第一期

  課程簡介:

本次的知識圖譜課程主要包括三大部分:

1)知識圖譜的工程方法論。指導學員了解并掌握知識圖譜的基本概念和發展歷史,梳理清知識圖譜的技術體系,掌握知識圖譜的核心技術原理,建立知識圖譜工程的方法論思維。

2)知識圖譜的實戰技術。從實戰出發,圍繞知識表示、知識抽取、語義搜索、知識問答、知識推理、知識融合等系統性介紹知識圖譜相關的實戰技術,使得學員具備研發知識圖譜相關應用的基礎能力。

3)知識圖譜的典型應用。結合醫療、金融、電商等實際應用場景,介紹知識圖譜各個技術點的實際應用落地方式,使得學員具備結合自身背景開展知識圖譜技術實踐的應用能力。

  主講老師:

王昊奮著名知識圖譜專家

博士畢業于上海交通大學,CCF術語專委會執委,中文信息學會語言與知識計算委員會副秘書長,共發表75余篇高水平論文。中文知識圖譜zhishi.me創始人,OpenKG聯盟發起人之一,其帶隊構建的語義搜索系統在Billion Triple Challenge中榮獲全球第2名;在著名的本體匹配競賽OAEI的實體匹配任務中斬獲得全球第1名。曾主持并參與多項國家自然科學基金、863重大專項和國家科技支撐項目,以學術負責人身份參與Paypal、Google、Intel、IBM、百度等企業的合作項目。

  開課時間:2017年10月24日

學習方式:

在線直播,共11次

每周2次(周二、四晚上20:00-22:00)

直播后提供錄制回放視頻,在線反復觀看,有效期1年

  課程大綱

第一課: 知識圖譜概論

1. 知識圖譜的起源和歷史

  2. 典型知識庫項目簡介

  3. 知識圖譜應用簡介

  4. 本次課程覆蓋的主要范圍:知識表示與建模、知識抽取與挖掘、知識存儲、知識融合、知識推理、語義搜索、知識問答和行業知識圖譜應用剖析等內容。

  第二課: 知識表示與知識建模

  1. 早期知識表示簡介

  2. 基于語義網的知識表示框架

  a. RDF和RDFS

  b. OWL和OWL2 Fragments

  c. SPARQL查詢語言

  d. Json-LD、RDFa、HTML5 MicroData等新型知識表示

  3. 典型知識庫項目的知識表示

  4. 基于本體工具(Protege)的知識建模最佳實踐

  第三課: 知識抽取與挖掘I

  1. 知識抽取任務定義和相關比賽:實體識別、關系抽取和事件抽取

  2. 面向結構化數據(關系數據庫)的知識抽取,包括D2RQ和R2RML等轉換與映射規范與技術介紹

  3. 面向半結構化數據(Web tables, 百科站點等)的知識抽取

  a. 基于正則表達式的方法

  b. Bootstrapping和Wrapper Induction介紹

  4. 實踐展示:基于百科數據的知識抽取

  第四課: 知識抽取與挖掘II

  1. 面向非結構化數據(文本)的知識抽取

  a. 基于本體的知識抽取,包括NELL和DeepDive系統介紹

  b. 開放知識抽取,包括TextRunner、Reverb和OLLIE等系統介紹

  2. 知識挖掘

  a. 知識內容挖掘:實體消歧與鏈接

  b. 知識結構挖掘:關聯規則挖掘與社區發現

  c. 知識表示學習與鏈接預測,包括TransE和PRA等算法介紹

  第五課: 知識存儲

  1. 基于關系數據庫的存儲設計,包括各種表設計和索引建立策略

  2. 基于RDF的圖數據庫介紹

  a. 開源數據庫介紹:Apache Jena、Sesame、gStore、RDF-3X等

  b. 商業數據庫介紹:Virtuoso、AllegroGraph、BlazeGraph等

  3. 原生圖數據庫介紹,包括Neo4j、OrientDB、Titan和Cayley等

  4. 實踐展示:使用Apache Jena存儲百科知識,并使用Fuseki構建圖譜查詢服務

  第六課: 知識融合

  1. 知識融合任務定義和相關競賽:本體對齊和實體匹配

  2. 本體對齊基本流程和常用方法

  a. 基于Linguistic的匹配

  b. 基于圖結構的匹配

  c. 基于外部知識庫的匹配

  3. 實體匹配基本流程和常用方法

  a. 基于分塊的多階段匹配

  b. 基于規則(配置或通過學習)的實體匹配

  4. 知識融合工具介紹:包括Falcon-AO、Silk、PARIS、DEDUPE、LIMES和KnowledgeVault

  5. 實踐展示:使用Falcon-AO融合百度百科與維基百科中的知識

  第七課: 知識推理

  1. 本體知識推理簡介與任務分類,包括概念可滿足性、概念包含、實例分類和一致性檢測等

  2. 本體推理方法與工具介紹

  a. 基于Tableaux運算的方法:Fact++、Racer、Pellet和Hermit等

  b. 基于一階查詢重寫的方法:Ontology-based Data Access的Ontop等

  c. 基于產生式規則的方法(如Rete):Jena、Sesame和OWLIM等

  d. 基于邏輯編程(如Datalog)改寫的方法:KAON2和RDFox等

  3. 實踐展示:使用Jena完成百科知識上的上下位推理、缺失類別補全和一致性檢測等

  第八課: 語義搜索

  1. 語義搜索概述,包括Knowledge Card、Rich Snippet、Facebook Graph Search等

  2. 基于語義標注的網頁搜索

  a. Web Data Commons項目介紹

  b. 排序算法介紹,擴展BM25

  3. 基于圖譜的知識搜索

  a. 本體搜索(ontology lookup)

  b. 探索式知識檢索,包括查詢構造、結果排序和分面(facets)推薦

  4. 知識可視化,包括本體、查詢、結果等的展現方式和可視化分析

  5. 實踐展示:使用ElasticSearch實現百科數據的語義搜索

  第九課: 知識問答I

  1. 知識問答概述和相關數據集(QALD和WebQuestions)

  2. 知識問答基本流程

  3. 知識問答主流方法介紹

  a. 基于模板的方法,包括模板定義、模板生成和模板匹配等步驟

  b. 基于語義解析的方法,包括資源映射,邏輯表達式候選生成與排序等

  c. 基于深度學習的方法

  第十課: 知識問答II

  1. IBM Watson問答系統及核心組件詳細解讀

  a. 問句理解

  b. 候選答案生成

  c. 基于證據的答案排序

  2. 實踐展示:面向百科知識的問答baseline實現

  第十一課: 行業知識圖譜應用

  1. 行業知識圖譜特點

  2. 行業知識圖譜應用,包括金融、醫療、數字圖書館等領域應用

  3. 行業知識圖譜構建與應用的挑戰

  4. 行業知識圖譜生命周期定義和關鍵組件

常見問題:

Q:參加本門課程有什么要求?

A: 有一定Python編程能力,有基本大學數學基礎。

Q: 有課外學習資料嗎?

A: 有,老師會根據情況提供講義,并給出進階學習資源與項目的建議。

  參團!咨詢!查看課程!

  就點這里!