培訓(xùn)安排:
2021年4月11-13日北京 4月25-27日廣州 5月29-31日成都
2021年6月28-30日北京 7月28-30日杭州 9月27-29日上海
2021年10月27-29日北京 11月28-20日珠海 12月28-30日北京
培訓(xùn)費(fèi)用:7800元/人(含培訓(xùn)費(fèi)、場地費(fèi)、考試證書費(fèi)、資料費(fèi)、學(xué)習(xí)期間午餐),食宿可統(tǒng)一安排,費(fèi)用自理。請(qǐng)學(xué)員帶身份證復(fù)印件一張。
培訓(xùn)收益:
課程中通過細(xì)致講解,使學(xué)員掌握該技術(shù)的本質(zhì)。具體收益包括:
1.掌握NLP基礎(chǔ);
2.關(guān)鍵詞提取與文本分類方法
3.文本向量化與句法分析方法
4.NLP與深度學(xué)習(xí)技術(shù)的相應(yīng)算法;
5.理解并掌握Tensorflow框架。
培訓(xùn)特色:
本次培訓(xùn)從實(shí)戰(zhàn)的角度對(duì)自然語言處理(NLP)進(jìn)行了全面的剖析,并結(jié)合實(shí)際案例分析和探討NLP的應(yīng)用場景,給NLP相關(guān)從業(yè)人員以指導(dǎo)和啟迪。
日程安排:
|
日程 |
培訓(xùn)模塊 |
培訓(xùn)內(nèi)容 |
|
第一天 上午 |
NLP入門與基礎(chǔ)介紹(一) |
1. NLP的基本概念 2. NLP的發(fā)展歷程 3. NLP主要研究方向 1) 句法語義分析 2) 信息抽取 3) 文本挖掘 4) 機(jī)器翻譯 5) 信息檢索 6) 問答系統(tǒng) 7) 對(duì)話系統(tǒng) |
|
第一天 下午 |
NLP入門與基礎(chǔ)介紹(二) |
4. NLP的基礎(chǔ) 1) 分詞 正向最大匹配算法 逆向最大匹配算法 雙向最大匹配算法 基于N-gram語言模型的分詞 基于HMM的分詞方法 基于CRF的分詞法法 2) 文本基本處理 文本提取 正在表達(dá)式 本文統(tǒng)計(jì) 3) 詞性標(biāo)注 基于最大熵的詞性標(biāo)注 基于統(tǒng)計(jì)最大概率輸出詞性 基于HMM詞性標(biāo)注 基于CRF的詞性標(biāo)注 4) 命名實(shí)體識(shí)別 基于CRF的命名實(shí)體識(shí)別 5. 案例 1) 在線中文分詞系統(tǒng)實(shí)戰(zhàn) 2) 命名實(shí)體識(shí)別接口開發(fā) 3) 基于詞性標(biāo)注的關(guān)鍵詞提取 |
|
第二天 上午 |
關(guān)鍵詞提取與文本分類(一) |
1. 關(guān)鍵詞提取概述 2. 關(guān)鍵詞提取算法 1) TF-IDF 2) LSA/LSI算法 3) PLSA算法 4) LDA算法 |
|
第二天 下午 |
關(guān)鍵詞提取與文本分類(二) |
3. 文本分類算法 1) 樸素貝葉斯 2) 線性分類器 3) 支持向量機(jī) 4) Bagging模型 5) Boosting模型 6) 淺層神經(jīng)網(wǎng)絡(luò) 4. 案例 1) 新聞主題提取 2) 新聞分類實(shí)戰(zhàn) |
|
第三天 上午 |
文本向量化與句法分析(一) |
1. 文本向量化概述 2. 文本向量化常用算法 1) 詞袋算法 2) HashTF算法 3) Word2Vec算法 4) Glove算法 |
|
第三天 下午 |
文本向量化與句法分析(二) |
3. 句法分析概述 4. 句法分析常用算法 1) PCFG算法 2) 條件隨機(jī)場算法 5. 案例 1) 文本情感分析的開發(fā)示例 2) 基于依存句法分詞的問句相似度計(jì)算 |
|
第四天 上午 |
NLP與深度學(xué)習(xí)(一) |
1. 深度學(xué)習(xí)概述 1) 神經(jīng)網(wǎng)絡(luò) 2) 損失函數(shù) 3) 梯度下降 2. 深度學(xué)習(xí)常用算法 1) CNN 2) RNN 3) GRU 4) LSTM |
|
第四天 下午 |
NLP與深度學(xué)習(xí)(二) |
3. Tensorflow框架學(xué)習(xí) 1) Tensorflow簡介 2) Tensorflow安裝 3) Tensorflow基礎(chǔ)使用 圖(graphs) 會(huì)話(session) 張量(tensor) 變量(Variable) 4) Tensorflow線性回歸以及分類的簡單使用 5) Tensorflow中各種優(yōu)化器的介紹 4. 案例 1) 基于CNN的文本分類 2) 基于RNN的歌詞生成 3) 基于LSTM的機(jī)器翻譯 4) 基于Seq2Seq的問答系統(tǒng) |
|
第五天 |
業(yè)內(nèi)經(jīng)驗(yàn)交流 | |
授課專家:
覃老師 上海大學(xué)物理學(xué)碩士,創(chuàng)業(yè)公司合伙人,技術(shù)總監(jiān)。機(jī)器學(xué)習(xí),深度學(xué)習(xí)領(lǐng)域多年一線開發(fā)研究經(jīng)驗(yàn),精通算法原理與編程實(shí)踐。曾使用Tensorflow,Caffe,Keras等深度學(xué)習(xí)框架完成過多項(xiàng)圖像,語音,nlp,搜索相關(guān)的人工智能實(shí)際項(xiàng)目,研發(fā)經(jīng)驗(yàn)豐富。擁有兩項(xiàng)國家專利。同時(shí)具有多年授課培訓(xùn)經(jīng)驗(yàn),講課通熟易懂,代碼風(fēng)格簡潔清晰。
楊老師 計(jì)算機(jī)博士,目前就職于中科院某研究所,長期從事深度學(xué)習(xí)與機(jī)器學(xué)習(xí)研究工作,在NLP與CV領(lǐng)域有很深造詣,主持多項(xiàng)科技專項(xiàng),并帶領(lǐng)團(tuán)隊(duì)深入一線研發(fā)并落地,XXX視頻監(jiān)控與分析系統(tǒng)、XXX輿情監(jiān)控系統(tǒng)、XXX智能對(duì)話系統(tǒng)及 XXX森林防火無人機(jī)跟拍系統(tǒng)等。申請(qǐng)發(fā)明專利2項(xiàng)、部級(jí)科技進(jìn)步二等獎(jiǎng)一次,在SIGIR、CIKM及AAAI的國際會(huì)議發(fā)表多篇文章。
趙老師 計(jì)算機(jī)博士,目前主要研究方向包括電子推薦、智能決策和大數(shù)據(jù)分析等。主持國家自然科學(xué)基金2項(xiàng)、中國博士后科研基金、上海市浦江人才、IBM Shared University Research以及多項(xiàng)企業(yè)合作課題等項(xiàng)目。已在《管理科學(xué)學(xué)報(bào)》、《系統(tǒng)工程學(xué)報(bào)》、Knowledge and Information Systems ,Information Processing & Management,Information Systems Frontiers等國內(nèi)外刊物和學(xué)術(shù)會(huì)議發(fā)表論文90多篇,其中被SCI、EI收錄40多篇。出版著作和教材《智能化的流程管理》、《客戶智能》、《商務(wù)智能(第四版)》、《商務(wù)智能數(shù)據(jù)分析的管理視角(第三版)》、《數(shù)據(jù)挖掘?qū)嵱冒咐返榷嗖俊?/P>
【報(bào)名咨詢】
聯(lián)系電話:010-62258232 62278113 13718601312 13120125786
聯(lián) 系 人:李先生 陳小姐